人工智能由成千上万的真实人提供动力


从委内瑞拉的化妆师到保守地区的妇女 , 世界各地的人们都在做数字化的针线活 , 例如在街上的照片周围的汽车上画框 , 给图像加标签以及录制计算机无法完全识别的语音片段 。
这些数据直接输入到“机器学习”算法中 , 该算法可帮助自动驾驶汽车绕过交通 , 让Alexa知道您想要开灯 。没有大量的这种人类标记数据 , 许多此类技术将无法工作 。
这些重复的任务各得几分钱 。但是 , 从总体上讲 , 这项工作可以在世界许多地方(甚至在)提供可观的薪水 。这种蓬勃发展但基本上看不见的家庭手工业代表了可以永远改变人类的技术的基础:人工智能将带动我们到处走 , 执行语言命令完美无缺 , 有一天可能会自己思考 。
搜索引擎Google和Bing长期培育了这种人工输入行业 , 他们十多年来一直使用人们来评估结果的准确性 。自2005年以来 , 亚马逊的Mechanical Turk服务将自由职业者与临时在线工作相匹配 , 还向全球研究人员提供了众包数据输入 。
【人工智能由成千上万的真实人提供动力】最近 , 投资者已经向Mighty AI和CrowdFlower等初创公司投入了数千万美元 , 这些初创公司正在开发软件 , 即使在智能手机上 , 也可以更轻松地标记照片和其他数据 。
CrowdFlower提供的这张未注明日期的图像组合显示了
CrowdFlower的“环内人”技术渲染之前和之后的情况 , 该技术提供了先进的工具 , 使人们可以标记和构造普通照片的每个部分并将其转换为结构化的“训练数据” AI系统可以理解和解释 。(通过AP的CrowdFlower)
风险资本家S.“ Soma” Somasegar说 , 他在满足机器学习算法需求方面看到了“数十亿美元的机会” 。他的公司Madrona Venture Group投资了Mighty AI 。他说 , 人类将“长期 , 长期 , 长期地处于循环之中” 。
准确的标签可能会在区分天空和卡车侧面的自动驾驶汽车之间有所区别 。这是特斯拉的Model S在2016年首次已知的涉及自动驾驶系统的致命事故中失败的标志 。
Mighty AI首席执行官Daryn Nakhuda说:“我们不是在构建游戏系统 , 而是在构建拯救生命的系统 。”
委内瑞拉马拉开波市31岁的自由化妆师Marjorie Aguilar每天花费4至6个??小时在交通对象周围绘制盒子 , 以帮助训练Mighty AI的自动驾驶系统 。
她的时薪约为50美分 , 但在一个通货膨胀失控 , 危机重重的中 , 仅几个小时的工作就可以支付玻利瓦尔一个月的房租 。
她说:“这听起来不算很多钱 , 但对我来说 , 这是相当不错的 。” “你可以想象对我来说用美元付款有多么重要 。”
这张未注明日期的照片由马乔里·阿吉拉尔(Marjorie Aguilar)提供 , 显示了阿吉拉尔在委内瑞拉的马拉开波 。马拉开波市的自由化妆师Aguilar每天花费四到六个小时在交通对象周围绘制盒子 , 以帮助训练Mighty AI的自动驾驶系统 。(由马乔里·阿吉拉尔(Marjorie Aguilar)通过AP提供)
阿里亚·赫里斯纳(Aria Khrisna)是尼西亚Tegal的三岁儿子 , 今年36岁 , 他在诸如eBay和亚马逊等网站的服装图片上添加文字标签 , 每月付给他约100美元 , 大约是他收入的一半 。
对于25岁的Shamima Khatoon来说 , 她在Metiabruz的数据标签公司iMerit的全女性前哨站为汽车 , 车道标线和交通信号灯做注释的工作 , 是她不得不在家外工作的唯一机会保守的穆斯林社区 。
她说:“这是一个提高技能和养家的好平台 。”
丰田 , 日产和福特等主要汽车制造商 , 优步(Uber)等打车公司以及Alphabet Inc.的Waymo等其他科技巨头都在通过第三方供应商支付大量的标签商 。
更高准确性的好处可能是立竿见影的 。
信息技术总监Scot Whigham表示 , 在洲际酒店集团 , 其数字助理Amelia可以接听的每个电话都可以节省5到10美元 。
当Amelia失败时 , 该程序在侦听呼叫的同时将呼叫重新路由到大约60个服务台工作人员之一 。它从他们的反应中吸取教训 , 并在下一个电话中试用该技术 , 从而使员工可以腾出时间做其他事情 。
Whigham说:“我们已经改变了这些工作 。”
当计算机无法打出客户致电凯悦酒店连锁酒店的电话时 , 音频片段就会发送到位于马萨诸塞州富兰克林的一座老式砖房中的AI呼叫中心Interactions 。
在那里 , 当客户等待电话时 , 一个戴着耳机的“意图分析家”中的一员会抄录从听不见的数字到亵渎行为的所有内容 , 并迅速指导计算机如何响应 。
该信息将反馈到系统中 。Interactions首席技术官Robert Nagle说:“下一次 , 我们有更大的机会获得成功 。”
研究人员试图找到针对人类标记数据的解决方法 , 但结果通常不足 。
在一个使用Google Street View停放的汽车图像来估算社区人口构成的项目中 , 当时斯坦福大学的研究员Timnit Gebru尝试通过刮擦Craigslist出售其所有者标记的汽车的照片来训练自己的AI 。
但是产品照片看起来与街景视图中的汽车图像完全不同 , 程序无法识别它们 。她说 , 最后 , 她花了35,000美元聘请了汽车经销商专家来标记她的数据 。
标签技术公司CrowdFlower的首席执行官Robin Bordoli说 , 对人类标签的需求是“巨大的”和“动态的” 。“您不能百分百相信算法 。”
目前 , 弄清楚如何在没有人类提供的所谓“地面真理”数据的情况下使计算机学习仍然是一个开放的研究问题 。
加州大学伯克利分校的机器学习专家Trevor Darrell表示 , 他预计将需要5到10年的时间才能使计算机算法无需人工标记就能学会执行 。
仅他的小组每年就花费数十万美元来支付人们对图像进行注释的费用 。他说:“现在 , 如果您要销售产品并且想要完美 , 那么不花钱在这种注释上就太过疏忽了 。”
像Alphabet的Waymo和游戏制造商Unity Technologies这样的多家公司正在开发模拟世界 , 以在可预定义每个对象的受控场景中训练其算法 。
在大多数情况下 , 即使是试图将人类赶出循环的公司也仍然依赖他们 。
例如 , CloudSight为网站和应用程序开发人员提供了一个方便的工具 , 用于上传照片并返回一些描述它的单词 。零售商Kohl's使用该服务在其应用程序上实现“即点即买”视觉搜索功能 。
但这不只是一个花哨的计算机程序 , 它会吐出响应 。如果该算法没有好的答案 , 那么它在 , 东南亚或非洲等地的800名员工之一会实时输入答案 。
“我们希望成为无需任何人参与即可标记任何图像的标签 , ” CloudSight业务开发负责人Ian Parnes说 。“要花多长时间是所有人的猜测 。”

    推荐阅读