Facebook的难题:AI能分析表情包,却难解内涵

  • 时间:
  • 浏览:0
  • 来源:3分快3下注平台-3分快3注册平台_3分快3官网平台

9月15日消息,《连线》网站撰文指出,Facebook名为Rosetta的人工智能技术平常可分析数十亿张含有文本的图像,才能分析表情包,但它能像人类那样理解表情包的内涵吗?

以下是文章主要内容:

每天是是不是数十亿的文本帖子、照片和视频被上传到社交媒体上,这是人类审核员无法全面筛选的有五个信息量级。就说 ,Facebook和YouTube等公司长期以来老会 依赖人工智能来帮助出理 垃圾邮件和色情内容等难题。

不过,对于机器来说,审核像白人至上主义的表情包但是的东西机会更具挑战性,机会这项任务还要一并出理 几种不同的视觉元素。自动化系统还要检测和“读取”叠打上去照片上的文字,并分析图像并是不是。表情包也是并是不是多样化的文化产物,很难脱离语境去理解。尽管它们带来了挑战,但你这人社交平台机会在使用人工智能来分析表情包,其中包括社交网络巨头Facebook。Facebook本周分享了它如何使用并是不是名为Rosetta的工具来分析含有文本的照片和视频的细节。

Facebook表示,它机会在使用Rosetta来自动检测违反其仇恨言论政策等规定的内容。该公司本周还敲定,在该工具的帮助下,它正在扩大其第三方事实核查的努力,纳入照片和视频,而不仅仅是基于文本的文章。Rosetta将自动检查含有文本的图像和视频是是不是曾被标记为错误,从而帮助完成审查。

Rosetta通过将光学字符识别(OCR)技术与你这人机器学习技术相结合来出理 照片和视频中的文本。首先,它使用OCR来识别文本在表情包或视频中的位置。你机会但是用过这人OCR的东西;它还才能我就快速浏览纸质表单,并将其转换为可编辑的文档。该自动化应用守护进程知道文本块的位置,才能将它们与你应该签名的地方区分开来。

一旦Rosetta知道文本在哪里,Facebook就会使用有五个神经网络来转录文本并理解其含义。就说 ,它还才能将文本传输到其它的系统,比如有五个检查表情包是是不是与机会被揭穿的病毒骗局有关的系统。

Rosetta的研究人员表示,该工具现在还才能实时从公开上传到Facebook的每张图片中提取文本,就说 还才能“阅读”多种语言的文本,包括英语、西班牙语、德语和阿拉伯语。(Facebook表示,Rosetta不用用于扫描用户在时间轴上私密分享的图像或私信。)

Rosetta还才能分析含有多种文本形式的图像,比如抗议标识、餐厅菜单、店面等的照片。在Facebook工作的软件工程师维斯瓦纳斯·西瓦库马尔(Viswanath Sivakumar)在一封电子邮件中说,你这人工具既能识别景观中的文本(比如街道标识),才能识别表情包——但后者更具挑战性。他写道,“在主动检测仇恨言论和你这人违反政策内容的情况下,分析表情包式的图像是一项更加多样化的人工智能挑战。”

西瓦库马尔指出,与人类不同,人工智能通常还要看完成千上万个例子才能学精完成多样化的任务。就说 ,即便是对于Facebook而言,表情包方面的例子就说 是无穷无尽的,就说 在不同的语言上分派足够多的例子也很困难。寻找高质量的训练数据是人工智能研究的有五个持续性挑战。数据通常需相当于 几滴 的功夫来进行手工标记,就说 你这人数据库都受到版权法的保护。

为了训练Rosetta,Facebook的研究人员使用了在网站上公开发布的含有并是不是文本形式的图片,以及它们的标注和发布地点信息。当当我们我们还创建了有五个应用守护进程来生成额外的示例,你这人做法的灵感来自于牛津大学的有五个研究团队在2016年设计的并是不是法律最好的办法。这导致 分析整个过程在并是不是程度上是自动化的:有五个应用守护进程自动地产生表情包,就说 但是应用守护进程试图分析它们。

不同的语言还给Facebook的人工智能团队带来了其它的挑战。这人,研究人员还要找到并是不是变通法律最好的办法来使得Rosetta才能用于阿拉伯语等语言。阿拉伯语从右到左阅读,与英语等你这人语言相反。Rosetta倒着“阅读”阿拉伯语,经过出理 后,Facebook将有有哪些字符颠倒过来。研究人员在当当我们我们的博客中写道:“你这人技巧的效果出奇的好,我不用 们有了有五个统一的模型,它既适用于从左到右的语言,也适用于从右到左的语言。”

实在自动化系统在内容审核方面非常有用,但它们无须老会 万无一失的。这人,腾讯的微信络使用有五个不同的算法来过滤图像,多伦多大学公民实验室的有五个研究团队成功地骗过了它们。第有五个算法是基于OCR的应用守护进程,会过滤含有特定话题文本的照片,而但是算法则会审查有有哪些看起来与中国政府机会创建的黑名单这人的照片。

研究人员才能通过改变图像的属性,比如颜色或方向,轻易地避开微信的过滤器。实在Facebook的Rosetta更加先进,但机会就说 是完美无缺;该系统机会会受困于难以阅读的文本或扭曲的字体。所有的图像识别算法也仍然机会会受到对抗性的例子的影响,有有哪些经过轻微改动的图像在人类看来是一样的,就说 导致 人工智能陷入混乱。

在对特定种类的内容的审核方面,Facebook和Twitter、YouTube和Reddit等你这人的平台在多个国家都面临着巨大的压力。周三,欧盟提出了一项新的法规,要求社交媒体公司在接到通知后一小时内删除恐怖分子的帖子,就说 将面临罚款。Rosetta和你这人这人的自动化工具机会在帮助Facebook和你这人平台在德国等地遵守这人的法律。

它们在那方面也做得更好了:两年前,Facebook首席执行官马克·扎克伯格(Mark Zuckerberg)曾说,Facebook的人工智能系统不还才能主动捕捉到该公司所删除内容的一半左右;当当我们我们还要很难标记其余要删除的内容。现在,Facebook表示,它的人工智能工具还才能检测到几乎80%的垃圾邮件、99.5%的恐怖内容和86%的暴力图片。YouTube等你这人平台在利用自动内容检测系统上也取得了同等程度的成功。

然而,有有哪些喜人的数字无须导致 分析像Rosetta但是的人工智能系统是完美的出理 方案,尤其是当涉及到更微妙的表达形式的但是。与餐馆菜单不同的是,机会他不知道表情包的发布背景,就很难理解它的含义。这就说 为有哪些有就说 网站在致力于解释它们。表情包通常描述的是圈内笑话,机会是针对特定的网络亚文化。人工智能仍然不还才能像人类那样理解表情包或视频。就目前而言,Facebook仍还要依靠人工审核员来决定是是不是应该删除某个表情包。