Discuz! Board

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 67|回复: 0

人工智能衡量语言清晰度

[复制链接]

1

主题

1

帖子

5

积分

新手上路

Rank: 1

积分
5
发表于 2024-1-18 16:46:49 | 显示全部楼层 |阅读模式


我是用通俗语言研究的结果。 “我衡量文本清晰的概率。这就是和知识工程研究所 (IIC) 创建的虚拟助手的呈现方式。 Clara 是一个经过训练可以识别清晰语言的人工智能系统。 尽管仍处于测试阶段,功能需要改进,但该应用程序已经可以作为写作辅助工具,并根据 9 种语言标准区分浅色和深色文本。 最近,在 Clara 界面的演示中,展示了它的工作原理、分析内容以及机器学习在西班牙语中的应用。 后者由 IIC 的计算语言学家 Carmen Torrijos 领导,陪同的还有 的创始合伙人领域的负责人 Itxaso Redondo 以及 Art 的合伙人兼总监 Quique Herrero。 评估清晰沟通后的初步结果 Clara 的目标是促进简单、清晰和透明的沟通。 助手会自动评估文本的清晰度,并在第一次分析中单独审查指标并给出改进建议。 NLP 为了评估 Clara,从网页中选择了 300 篇文本:首先是来自行政部门和公共组织,但也来自公司、大学社交网络和国际组织 (7)。 所有这些都是与健康危机或公民频繁程序相关的文本。 在分析并衡量其清晰度后,大多数行政文本都未能通过测试。

我们认为从 65% 开始他们就清楚了。说道。 在不太清 塞内加尔电话号码表 楚的文本中,我们发现了来自税务局、SEPE、社会保障、劳动部的文本或与最低生活收入或流行病相关的文本。 在最常见的错误中,以下几点最为突出: 缺乏推论连接。 西班牙语常用单词不足,使用技术细节。 每句话的字数过多,导致阅读和理解变得困难。 另一方面,主要社交媒体公司为其用户编写的文本最有可能是清晰的。 他们使用简短的短语、话语连接词、常用词和具有简单句法结构的直接风格。 机器学习和 NLP 来衡量文本的清晰度 Clara 是人工智能支持的评估语言清晰度的工具。 然而,正如卡门·托里霍斯所解释的那样,如果不考虑到这些是关于人类认知过程的隐喻,就不能说它“学习”或“理解”,我们必须注意不要对机器的能力产生错误的期望。 “一个多学科团队教会克拉拉区分明文和非明文。 通过带注释的语料库、专门设计的语言度量以及机器学习和自然语言处理(NLP)技术,”他补充道。 她本人负责澄清助理和计算语言学发展的概念,计算语言学是一门处理人类语言自动处理的混合学科。



过程检测 人工智能模型是如何训练的? 为了自动分析任何西班牙语文本的清晰度,遵循了结合 NLP 和机器学习的工作流程: 准备带注释的语料库:1000 个真实的行政和法律文本,标记为“清晰”和“不清楚”根据专家的意见。 开发 9 个语言指标来评估清晰度。 基于标签和人类意见以及测量结果的机器学习模型的训练。 开发 Rest API,使 Clara 成为易于使用的在线服务。 助手开发完成后,我们选择了另外 300 个文本来检查它测量语言清晰度的准确度。 简单语言助手如何进化? 文本分析Clara 已准备好分析文本的清晰度,但现在的目标是改进其功能。 该工具旨在为读者提供更清晰的写作支持,并为作者节省时间; 因此,如果您实时纠正您发现的令人困惑的术语或推荐更简单的术语,将会很有用。 目前,建议的改进是: 增加语料库以重新训练它并通过新示例提高其性能。 新的语言指标:治疗你和你的关系、首字母缩略词和首字母缩略词的识别、专有名称的识别……向用户学习。 利用界面中提供的新文本,实现持续再训练。 BERT 语言模型。 NLP 的最新进展之一将允许考虑上下文以更好地“理解”消息。 还考虑将该模型应用于其他领域。 目前,Clara 专为行政和法律部门设计,以促进与用户的沟通,并提高公司和机构向公民提供的信息的清晰度。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|DiscuzX

GMT+8, 2026-1-14 12:22 , Processed in 0.087249 second(s), 19 queries .

Powered by Discuz! DISCUZ_VERSION

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表