年轻人喜欢创造很多新词,很多时候给长辈理解带来了很大的障碍,如何辅助理解这些词?在大模型时代应该有新的回答。甚至微博还出台集中整治利用谐音字、变体字等“错别字”发布、传播不良信息的违规行为

实例

  • “90后哋焱暒妏叒婹苁偅炪茳煳孒(90后的火星文又要重出江湖了)”
  • “政府”写成“zf”、“政治立场”变成“zzlc”、“人民币”变成“软妹币”和“米”、“笑死了”改成“笑不活了”

成因

在社会(Society)中,有很多 anti-society会形成小的封闭的society,为了便于小社会的沟通,必然会形成一些这个社群独有沟通方式,也成为反语言(ani-language)。

同性恋

这个性少数群体,有很多这个社群独有的词汇,例如:

  • 通讯录
  • 弯等等。

甚至一些词汇被这个群体所选用以后,其他人反而不能用,或者羞于使用。

反语言构造

  1. 缩写。YYDS
  2. 谐音(有意谐音、无意谐音)。深井冰,兰州烧饼。
  3. 简单语素重新赋义。口吐芬芳。

挑战

传统的需要使用大规模语料进行训练的方法,可能是不现实的,当语料大到一定程度,例如同志这个词,就会被弃用。

已有工具

  1. 网易云盾

参考资料

  1. 互联网同性恋社群反语言词汇分析

  2. Cants And Anti-Languages