作者:Daily Sabah with DHA
在土耳其南部的阿达纳,以其丰富的文化和历史而闻名,该国最全面的数字谚语词典已使用人工智能创建,其中包含 18,000 多条谚语。
项目负责人、阿库罗瓦大学土耳其语言文学系教授 Engin éetin 的目标是在一年内将谚语数量增加到 30,000 条,他说:“读者将能够找到从我们最早的文本(例如鄂尔浑铭文)到 20 世纪初记录的所有谚语。我们的项目也是一项历史研究,涵盖以下内容:1,200年的期限。”
埃廷两年前发起了“从中亚到安纳托利亚的土耳其谚语项目”。作为该项目的一部分,谚语是从中亚发现的最古老的土耳其文本到现代书写的文本中汇编而成的。这数千条谚语经过分类,变成了一本包含例句的综合词典。利用人工智能,这些谚语被数字化,并在阿库罗娃大学官方网站上向公众开放。
该集合旨在提供用户友好的定义、历史背景和例句,对于完成作业的学生、布置作业的教师以及进行比较和历史研究的研究人员来说非常有价值。
Engin éetin 教授强调该项目已经制作了有史以来最全面的土耳其语词典,他解释说:“迄今为止为土耳其语准备的最广泛的谚语词典包括大约 10,000 条谚语。但我们的项目目前包含超过 18,000 条谚语,我们仍然有一年的时间来研究它。”
“我们预计这个数字将达到近 30,000;虽然我们称之为土耳其语最全面的项目,但我们可以自信地说,它也是世界语言中最广泛的项目。在我们的研究中,我们找不到任何其他项目致力于世界范围内任何一种语言的谚语研究,其范围与这种语言一样广泛,”他补充道。
在解释人工智能在该项目中的作用时,埃廷教授表示:“我们开发了将数千条谚语数字化的软件,该软件在与阿库罗娃大学相关的域下运行;开发这个软件花了几个月的时间,我们一直在输入自中亚时代起所有的谚语都被纳入这个软件中。”
“我们的研究人员和工作人员将谚语一一输入,按含义进行分类并分配关键字,读者不仅可以找到他们正在搜索的具体谚语,还可以看到类似谚语的列表、它们的定义、历史背景和信息。无论其含义是积极的还是消极的,”他说。
回顾这个项目背后的灵感,阿伊廷表示,这个项目源于他的童年,受到父母经常使用谚语的影响。“我们的项目于 2022 年开始,我们将继续开发它一年。读者将能够找到我们最早的文本中记录的谚语,从鄂尔浑铭文到 20 世纪初。我们的项目是一项历史研究,涵盖 1,200-一年期间,”他补充道。