$海天瑞声 sh688787$ 目前人工智能对中文理解很差,百度和昆仑万维的aigc做图都惨不忍睹。百度也说了目前“文心一言”用的是英文标注数据。百度为了短期尽快推出大模型,中文训练根本来不及,所以临时用了英文标注数据。但第一版大模型发布后,应该可以缓一缓,接下来应该好好做中文的优化。
微软发出警告:禁止竞争对手使用必应数据库支持 AI 工具,说明了数据壁垒的重要性。
接下来发力的的应该是中文优质训练数据。
核心标的 :
海天瑞声 (现成大量标注中文数据)
同方股份 (拥有中国知网,中文最大论文期刊数据库,最优质知识型数据,上过大学的都知道。中文aigc以后要写论文,肯定绕不开知网。质量和可用性肯定比中文在线的小说强太多。)
拓尔思 (ZF官方大数据,AIGC,企业内网搜索引擎,chatgpt无法渗透的领域)
其他
中文搜索引擎 三六零
华为EDA利好 拓维信息