IT消息
时下位置: 金沙平台网站 > IT消息 >   IT圈

谷歌翻译窘境破局AI不是人工什么也会有性别成见

2020-06-25 17:14:00 IT着眼网 义务NO杜一帆0322 编纂:好麦 浏览数:9金沙平台网站

AI艺术没有性别,却为何有性别偏见?图表来自:MediumAI或机器学习技术自然没有性别可谈,可性别偏见和另外社会偏见(如对年龄、工作、宗教、种族、甚至是市区的偏和歧视)却常出现在AI产品之中,这也是现阶段AI行业极为关...

AI艺术没有性别,却为何有性别偏见?

图表来自:Medium

AI或机器学习技术自然没有性别可谈,可性别偏见和另外社会偏见(如对年龄、工作、宗教、种族、甚至是市区的偏和歧视)却常出现在AI产品之中,这也是现阶段AI行业极为关心的题目之一。

Google Translate的管理者Macduff Hughes在吸收媒体采访时解释了AI艺术“自带”偏见的缘故,AI和机器学习技术是通过训练数据来促成对产品和劳务的支持的,而那些训练数据都是来自真实的社会现象,也就难免带有社会中既有之各族偏见或歧视,接到了那些数据的AI模型则会“此起彼伏”那些传统。

他家在采取产品时又会受到这些偏见的影响,长期形成恶性循环,导致以性别偏见为代表的种种社会歧视越来越根深蒂固,而此种“偏见”的文件数据越多,AI模型会慢慢的变“社会化”,和食指一样对事物产生固有的体会偏见。

删去产生“性别偏见”的翻译文本外,Google Translate还曾因将军胡乱输入的原文本翻译成恐怖之道教预言而备受关注,这与Macduff Hughes诠释的AI及机器学习的底色运作机制有直接的联络,因为Google Translate用于打造AI产品时采用的教练数据往往都是佛教文本。

Google Translate会将原来毫无意义之语言翻译成恐怖之后期预言。

图表来自:Vice

在2018年,有的是用到Google Translate的客户发现了一番可怖的景象。Google Translate会将原来毫无意义胡乱输入的原语言,翻译成末日预言,种种阴谋论也一时间甚嚣尘上。

对于当时热议的“阴谋论”事件,Macduff Hughes也做了应有的诠释,这还是同Google的教练数据有关的。虽然有为数不少人口把这件事归咎于神秘的道教主义或者外星人攻击等原因上,但其实这是机器学习模型十分广阔的题目。顶用户之涌入超出了机器学习模型的预料后,回到的数目也将是不合常规的。

2018年,Google Translate的客户发现在主业毛利语至英语方向,翻译19个“dog”时,会显示出圣 经中的末世预言。

图表来自:Vice

BBN科技企业研究机器翻译的学者Sean Colbath,在这次曾对此事件发表同样的眼光,“如果他们(Google Translate)采取宗教文本作为训练数据来构建机器学习模型,那最后产出的文件就有很大的可能是带有宗教意味的”。

在本次事件之后,Google Translate也加大了对于AI扮演偏见化的难度,最先就是在孩子性别平等方面的埋头苦干。正如Macduff Hughes所说的,“Google表现业内的先锋,会带领整个行业解决这样一些问题,最先就要消灭在文件翻译服务中出现的派别歧视的题目”。

如果现实的语言文本中就存在性别偏见,这就是说翻译模型就会学习到那些偏见,甚至强化它们。例如,顶一种工作在60%-70%的情况下都是由男性承担的,这就是说翻译系统就会学习到这一特征,而在生产翻译时,把这种职业100%地归属于男性,这一点就是Google Translate要求解决之题目。

有关这一问题最突出的例证就是“大夫”和“护士”,在最早的Google Translate美方,机器翻译都会将原来应是性别中性的词语转换成男性属性的词语,重现现实社会中已部分偏见,威尼斯Google Translate产品经营的James Kuczmarski在博客中写到,“像‘年富力强’、‘大夫’等词语都会和女性挂钩,而‘护士’、‘优美’等词语则会和异性挂钩”。

而采取Google Translate的大队人马用户常常都抱有学习语言的目的,那些用户需求了解不同景象中语言文本的轻微差别。这也是Google Translate决定启动“性别项目”的初衷。

其实早在2016年,Google Translate表现机器翻译行业技术探索的先锋就一直在利用最新的技能。2016年,Google Translate初次用到了“神经机器翻译”(Neural Machine Translation),而摒弃了经典的“统计机器翻译”(Statistical Machine Translation)。“统计机器翻译”其实是对文本进行逐字翻译,但是无法考虑到词性、时态、语序等语法因素,常导致最后的散文错误百出。而“神经机器翻译”则是逐句翻译,会将上述因素进行更好的拍卖。

采取了“神经机器翻译”艺术之Google Translate可以产出更加自然、顺手的散文,也具备了生产不同风格文本的动力(如正式场合使用的语言风格或者生活中采取的俗语俚语风格)。

到了2018年12月,Google Translate为了消灭性别偏见问题,又推出了“性别特定的翻译功能”(Gender-specific Translation)。北爱尔兰语作为一种中性语言(即没有区别性别的总称代词)最先开始支持该功能。

“性别特定的翻译功能”支持译出两种性别场景的散文,供客户挑选。

图表来自:The Verge

在此新功能的支持从,他家输入一枝无强烈性别信息的原文,会把更换为“女性”和“男性”两种现象的翻译。两种翻译都会展示在翻译结果中,由用户自行选择。

Google Translate科研团队采用了非常的拍卖模型,穿过三个步骤将原文本转换为两种性别格式的翻译文本。最先,机械模型需要判断原文是否为“中性”语言文本,即未明确指出人称性别的文件;接下来,Google Translate名将推出男女两种人称的独立译文;说到底再进行准确度检查。

此种处理模式首先被运用在将伊拉克语翻译为英语的状况中,可支持短语和短句的翻译。此后又把拓展到将英语翻译为以色列语的状况中,西班牙语和意大利语与英语的互译是Google Translate美方客户的真正需求最大的两种语言对。这一功能最早支持用户在Chrome或者Firefox传感器上采取,此起彼伏又计划在运动端及其他平台推出。

Google一直在开展Google Translate的应用平台,其中也包括自家的蓝牙耳机Pixel Buds。

图表来自:The Verge

但是当Google Translate未雨绸缪将这一模式应用在更多语言的翻译中时,意识此方案之可扩展性有很大问题。切实来说,在采取“神经机器翻译”艺术生产两种“性别”的文件时,任何机器翻译系统之失业率较低。比如,顶出现10条有必不可少进行“性别特定翻译功能”拍卖的文件时,系统只能够辨认其中的4条。另外,如果要为每一种像阿拉伯语一样的“中性语言”安排可进行性别判定的分类识别器,名将急需巨大的数目量来训练机器模型,可进行性极低,短期之内无法将此种力量应用到更多语言上。

本年的4月22日,Google Translate通告解决了以前方案可进行性较低的题目,并将“性别特定翻译功能”开展到英语与西班牙语、巴勒斯坦语、秘鲁语以及希腊语的翻译场景中。这种拓展性更强的解决方案优化了以前的拍卖模型,采取“重写”(Rewriting)加“译后编辑”(Post-editing)的主意,代表了以前的“认清”加“分手翻译”的拍卖模式,不再依赖于需要大量数目进行训练的派别识别器。

“咱此次的AI艺术方案实现了举世瞩目的习性提升,不仅增进了性别判定的质,而且将功能拓展到了另外4种语言上,”Google尖端软件研发工程师Melvin Johnson这样写到,“咱将持续沿着这个样子探索下去,从一地准备解决长文本翻译中的性别偏见问题。”

本来处理模式和多元化处理模式对比。

图表来自:Google AI Blog

在新的处理模式下,系统不需要在关键步对原文进行判别,而是直接生产默认的翻译文本;在第二步则由“重写”效益,推出与默认翻译文本对立性别的本文。比如说,默认翻译文本是“她是一名医生”,则重写功能会生产对应的文件“他是一名医生”。说到底再对两则翻译文本进行准确度检查,合同只有性别因素不同,其余因素保持一致。

要落实优化模式中的“重写”效益也绝非易事,Google为了落实该功能使用了百万级的教练语例,那些训练文本中包含了区分两种性别的双语词组。鉴于这样规模之双语文本数据在短期之内很难获得,Google Translate组织还采取算法对现有的单语数据进行了处理,为伊生成了包含对应性别的语例文本。

用算法对单语文本做处理,推出对应的双语文本数据。

图表来自:Google AI Blog

拥有足够的教练数据后,Google Translate也投入了标点和格的转变(指主格、宾格、所有格等转移),加强模型的长治久安。利用此种模型可实现高达99%的派别判定准确度。

Google Translate本次使用的法制化版AI艺术,名将4种语言与英语的文件互译中的“性别偏见”调减了90%上述,而用使用原方案之荷兰语-英语翻译场景中,对“性别偏见”的消灭度也从60%上升到了95%。系统判别是否需要展示两种性别文本的资信度稳定在97%。

Google Translate在采取AI开展机器翻译的征途上引领着艺术风潮。

图表来自:Pixabay

Google Translate虽然称不上完美,也远远无法代替专业的人类译者,但人家在削减性别偏见的征途上的每一次进步,都体现了Google对于减少AI性别偏见的埋头苦干。AI艺术是由人类创造的并塑造的,艺术从业者需要像Google Translate一样,制造更公正平等的AI产品反哺社会,援助人类向更文明之趋向发展。

分享到:

自主经营权与免责声明:

凡未注明"稿件来源"的情节均为转载稿,资产网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,资产网并不意味着赞同其观点或证实其内容的实事求是;


本文地址:http://agpmobile.com/news/2020/06/25/32430020.html

转载本站原创文章请注明来源:金沙平台网站

行业聚焦

高高的 12W 性能释放,联想 YOGA Duet 法定测试

IT的师6月19日消息 联想 YOGA Duet 13 英寸二合一平板笔记本电脑昨天正式开卖,十代i5+ 16GB内存+512GB SSD首发售价69...[详细]

宏碁推出 C250i 便携投影仪:安排自动屏幕旋转技术

IT的师5月19日消息 根据网友投递线索,宏碁 C250i 便携投影仪已在洞东平台上架,菜价2999元,6月1日京东首发。IT的师了解到,C250i投影机最早于...[详细]

陷口水战!浑水指控维护刷单水军,跟谁学回应

5月29日消息,在5月18日针对跟谁学(NYSE:GSX)初次发布做空报告之后,浑水于昨晚再度宣布针对跟谁学的做空报告。该单位在昨天夜间发表名为“小班课大谎言”的...[详细]

刘作虎:一加将扩大产品线,为更多用户带来好产品

5月26日晚,一加CEO兼创始人刘作虎通过微博宣布,前途一加将会扩充新的产品线,同时推出更多不同价位段的产品。一直以来,一加坚持聚焦高端智能手机产品,并成为举世...[详细]

小米 MIUI 12 全局自由窗口,都有哪些妙用?

IT的师6月24日消息 在小米MIUI 12 美方添加了全局自由窗口新功能,法定介绍称,召之即来,挥之即去,一地挂起,便民加倍!MIUI全局自由窗口符合...[详细]

科技趋势

更多

一半网站已用上HTTPS 你用上了吗(附转换教程)

 

而今人们上网购物、聊天、浏览信息,其中不乏很多隐私敏感的消息,开始网站的开发者们设计的http并没有想那么多,因为htt...[详细]

全新宝马 4 系正式发表:超大双肾格栅,初次同时标配 CarPlay 和 Android Auto

 

IT的师 6 月 3 日消息 2021 款宝马 4 系轿跑已正式发表,采取了崭新的将来脸设计,双肾格栅更大,新车也是宝马首...[详细]

华硕推出灵耀 AX6600 路由青花国潮限定版,单只 1888 元

 

IT的师6 月 12 日消息 根据华硕官方的信息,灵耀 AX6600 Wi-Fi 6 路由青花国潮限定版将于 618 全...[详细]

真无线耳机市场 Q1 新金沙平台网站出货量 / 特区占率“1 学者打 4 学者”,华为增速最快

 

IT的师6月21日消息 享誉分析机构Canalys通告2020 Q1中外智能音频设备(耳机/动静)总出货数据报...[详细]

三星 Galaxy Tab S7 Plus 渲染图出炉:12.4 英寸 120Hz 大屏

 

IT的师 6 月 17 日消息 爆料达人 OnLeaks 和框架制造商 Pigtou 通告了还未发表之三星平板电脑 Ga...[详细]

  • 1
  • 2
  • 3
  • 4
  • 5
  • 一周排名 本月关注
  • 01Win10研制文件提示“客户端没有所需的期权”怎么解决?
  • 02Win10如何修改ie传感器默认的搜索引擎?
  • 03金沙平台网站敲定 Win10 创新策略:春天更新注重新功能,盛夏强调优化
  • 04荣誉 MagicBook Pro 2020 安排公布:高高的i7+MX 350,表配16GB内存
  • 05金沙平台网站双屏 Surface Duo 上的安卓应用体验
  • 06雷诺集团Zity在河内部署电动汽车共享服务
  • 07一半网站已用上HTTPS 你用上了吗(附转换教程)
  • 08高高的 12W 性能释放,联想 YOGA Duet 法定测试
  • 09小米集团主要季度盈利23.01亿元同比增长10.6%
  • 1014999 元起,TCL V30 聪慧会议平板今天发表:一键切换安卓、Windows 系统
  •