网络不规范字词研究:博流量、显个性,视频平台文字错误率高

澎湃新闻   2023-06-09 09:08:09


【资料图】

近年来,网络视频发展迅猛,一些作者为了追求流量,往往在视频中使用一些不规范用字,这不仅容易造成互联网信息传递障碍,也对汉字文化传承造成负面影响。

6月8日,由澎湃新闻牵头发起,上海人工智能研究院、上海市信息安全测评认证中心、上海新华传媒连锁有限公司和上海蜜度信息技术有限公司联合共建的“数字内容生态实验室”发布《网络不规范用字用词现象研究报告》。报告随机抽取2022年12月到2023年3月期间互动论坛、数字报、客户端、微博、网站、微信、短视频平台七类信源内容,形成具有4946.3万条、706.6亿字内容的样本,对其中不规范字词的出现频率及特征进行对比分析,发现各来源出现不规范字词的万字错误率平均为0.192/10000,其中数字报错误率最低,仅为0.129/10000,短视频平台错误率最高,达到0.615/10000。

营销号在视频及标题中滥用繁体字吸引观众注意

个人用户在视频标题中使用繁体字表现个性根据统计不同来源内容中误用繁体字、异体字、异形词、常见错误等四类不规范字词的TOP10,报告指出,视频作为以影像、声音为主的复合信息载体,是目前受众最广泛的信息传播手段。为获取流量,机构创作者的视频中常采用拼音缩写、繁体字、猎奇字词等吸引观众注意力,个人创作者的视频存在通过不规范字词表现个性的现象;视频信息主要画面、声音传递,在标题及字幕部分的不规范字词使用对信息表达影响小,这是视频中不规范字词使用远超同样具有个性化表达特征的微博平台的原因。从视频创作的自身规律来看,创作者往往在视频、音频编辑环节用时较多,在文字信息编辑环节用时较少,在审阅时对文字关注度不够,形近字、同音字等问题易被疏忽,且视频发布后错误较难更正,客观上造成视频中错误字词多的现象。因此,更需要探索在视频创作和传播中避免不规范字词问题的有效手段。

视频不规范用字TOP10在互动论坛,因字音字形相近导致的常见错误和繁体字误用问题较为突出,如帐(账)号、岀(出)、沒(没)等字词容易混淆。微博中不规范用词中口语化、个性化风格明显,妳(你)、愛(爱)、米(美)国等字词均属于网络流行语,如不能及时纠正,会导致更加广泛的影响,形成用错字、用繁体的错误风气。数字报、客户端、微信渠道误用的异形词重合度大,且主要是书面表达中具有文学色彩的词,显示出当前在文学词语规范使用普及中存在短板。网站渠道不规范字词出现频率高,既包含书面语、口语的常见误用,也存在谐音字的故意误用;异体字、异形词错用也有较高频次,可能与网站多元内容主题有关,也与网站分类中包含境外网站有关,侧面反映了复杂多元的互联网场景中规范字词面临的挑战。网络不规范用字问题频发,不仅影响人们对汉字的理解和使用,也对公众造成不良示范。对此,报告提出需重视技术作用,推广用字用词规范;发挥政府、媒体正向影响力,做好主流引导示范;内容平台发起倡议,形成规范用字氛围;开展专项监测,支撑语言规范推广等互联网汉字规范使用建议。同时,建议成立由网络监管部门牵头、多方合作的网络语言生态联合体,以技术监管平台建设、规范用字用词评估、政策建议发布,形成促进互联网语言规范化的合力,推动规范、积极、向上的互联网语言生态建设。

(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)

猜你喜欢