如何测试ChatGPT的语义理解与常识推理水平?

——兼谈大语言模型时代语言学的挑战与机会

  • 打印
  • 收藏
收藏成功


打开文本图片集

关键词ChatGPT;大语言模型;新图灵测试;威诺格拉德模式挑战;WinoGrande数据集

一、引言:大语言模型给语言学带来的挑战与机会

照理说,语言学家应该是欢迎语言技术的进步与飞跃发展的,但是当人工智能聊天机器人ChatGPT风靡全网、风光无限时,不少语言学家又感到危机空前,因为ChatGPT等大语言模型(largelanguagemodel,LLM)在语言理解与生成方面功能强大,并且几乎绕开了当代主流的语言学理论与方法(详见Piantadosi2023)。(剩余20618字)

monitor