-
题、开花结果,并形成可复制可推广的经验。新词迸发、“新”意盎然,但“改革”既是“名词”,更是“动词”。围绕会议中出现的新词汇、新语料,尤其需要我们大胆闯、大胆试,以改革促发展、靠改革作示范,提升创造性落实的能力和本领。期待这些生动的表述、新颖的概念,不仅出现在...
2024.08.01 17:33:00
-
成“智”而不“能”。此外,人工智能时代,数据是基石。有必要引导全社会共同参与,整合各方力量,推动数据分级分类有序开放,打造高质量语料,助力人工智能更好落地。
推进人工智能与产业融合,还有赖技术和政策的协同创新。新一代人工智能技术的走深走实,要在算法模型、智能算...
2023.11.06 09:17:00
-
十二版《新华字典》,一些罕见字“跃然网上”……网络用语虽然存在大量不规范,但也有不少字词用法冲破“次元壁”,给予时代表达更丰富的语料。做好互联网时代的语言文字工作,要守住正确表达的底线,也为创新表达留出空间。2021年发布的《国务院办公厅关于全面加强新时代语言文字...
2023.07.12 09:15:00
-
前不久印发的《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023—2024年)》提出,“建立多模态公共数据集,打造高质量中文语料数据”。期待各地各行业从实际出发,加强高质量数据供给,为大模型成长提供充足“养料”。
人工智能大模型研发周期长、投入大、风险高。...
2023.06.16 09:03:00
-
尤其是非人文社科专业的学生,他们的内在学习动力很大程度影响着最终成果。
不久前,浙江大学汉语言研究所调研了国内互联网平台过去3年的语料,本月发布的《近期互联网语言文字规范调查报告》指出,网络语言文字的不规范表达现象,主要源自年轻网民追求新鲜表达方式,如“YYDS”,...
2022.11.30 18:29:00
-
通信和计算机自然语言处理都要求曾经软性的字表、词表、方案发展为硬性的规范标准。汉字和少数民族语言文字的编码字符集、字形规范标准、语料库标准、机器翻译评测规范等发展迅速。
当前,中文国际化程度迅速提高,国际中文教育发展一日千里。在实现了国内文盲扫除、语言生活和谐、...
2021.04.07 09:02:00
-
肺炎疫情相关的词汇多达7个。这既是对全年重点事件的忠实盘点,也从一个侧面记录了中国上下抗击疫情的非凡历程。
本次流行语评选所基于的语料库,源自2020年1月1日至11月底国内的15家报纸、12个电视台和7个电台的节目、2个门户网站,数据规模10余亿字次,足以代表主流媒体的关注焦...
2020.12.17 17:44:00
-
【文化评析】
从2004年开始,作为当今全球最权威的英文词典之一,《牛津英语词典》基于对语料库的大数据分析,每年都会发布一个年度词汇。但今年,疫情的冲击、错综复杂的全球局势引发英语词汇的激烈变化,大量新词涌现出来。这直接导致《牛津英语词典》官方决定放弃用一个单一词汇...
2020.12.10 09:14:00
-
发展的必要之举。尤其在大数据时代,语言信息处理和通用计算快速发展,依靠技术赋能收集自然语言文本、进行语法标注和语义分析、形成专业语料库,进而为机器识别自然语言、深度学习和智能翻译等领域提供结构化知识,正在成为现实。
语言是人类文明的载体,把语音固定为书写、记录的...
2020.08.21 08:52:00
-
各国都比较重视生物医药领域的原创药物投入、企业专利布局、医疗物资生产等,但相关的语言服务有待升级。就我国而言,目前疫情相关的医学语料库、术语库尚不完备,普通译员缺乏专业领域的知识储备,医疗产品进出口和科技领域的语言服务质量存在不小的质量标准差异。中国向24个国家...
2020.06.04 08:47:00