年轻人喜欢创造很多新词,很多时候给长辈理解带来了很大的障碍,如何辅助理解这些词?在大模型时代应该有新的回答。甚至微博还出台集中整治利用谐音字、变体字等“错别字”发布、传播不良信息的违规行为
实例
- “90后哋焱暒妏叒婹苁偅炪茳煳孒(90后的火星文又要重出江湖了)”
- “政府”写成“zf”、“政治立场”变成“zzlc”、“人民币”变成“软妹币”和“米”、“笑死了”改成“笑不活了”
成因
在社会(Society)中,有很多 anti-society会形成小的封闭的society,为了便于小社会的沟通,必然会形成一些这个社群独有沟通方式,也成为反语言(ani-language)。
同性恋
这个性少数群体,有很多这个社群独有的词汇,例如:
- 通讯录
- 直
- 弯等等。
甚至一些词汇被这个群体所选用以后,其他人反而不能用,或者羞于使用。
反语言构造
- 缩写。YYDS
- 谐音(有意谐音、无意谐音)。深井冰,兰州烧饼。
- 简单语素重新赋义。口吐芬芳。
挑战
传统的需要使用大规模语料进行训练的方法,可能是不现实的,当语料大到一定程度,例如同志这个词,就会被弃用。