3 月 12 日,Facebook 研究团队表示将启动一个从视频中学习(Learning from Videos)的项目。具体而言,是将通过人工智能对上载到网络上的语音、图片以及视频资源进行学习处理。该项目的推出,将一定程度上能够完善和增强 Instagram Reels 的推荐功能,从而更加精准地匹配用户所需与平台资源之间的衔接。
(来源:Pixabay)
机器学习最大的困难,或许就在于它不能像人一样,针对具体场景做出具体情境下的判断、结论,虽然这个过程具有一定的逻辑性,但它并不会完全等同于人脑的理解。
Instagram 海量视频和图片的实验
作为 Facebook 的子公司,Instagram 这家以分享图片和视频为主的的社交空间,在过去十年时间,已经成长为全球最大图片数据库之一,积累了将近十亿张图片素材。在此基础上,Facebook 将利用 Instagram 庞大的十亿张公开照片数据库,进行抓取、识别和处理,以此展开 AI 智能人工训练,获取自己在行业的技术领先地位。
比如,在当前同一视频或者图像下,可通过该程序准确识别和判断其背后的相关内容和视频资源,实现用户与平台资源的匹配对接。与此同时,从视频中学习这一项目的优越性还表现在对于语音识别方面的容错率有了大大的降低。换言之,相比于传统的语音识别和文本转化,从视频中学习这一人工智能程序可以大大降低错误。
(来源:Pixabay)
相关研究人员在博客中写到:通过学习遍及几乎每个国家和数百种语言的全球公开视频流,我们的 AI 系统不仅可以提高准确性,还可以适应我们快速发展的世界,并认识到不同文化和地区之间的细微差别和视觉。
AI 解析视频,数据铺就商业道路
就当下而言,各个地区和文化之间的联系日益密切,不论是语言还是文字或者其他记录符号,都在加速演变成人与人,地区与地区之间的交流形式。一方面,AI 系统在提高准确性的基础上,通过对世界各个国家语言、文本的识别和翻译,可以传递给用户更直接、更精准的信息,从而保证信息、文化多样性的传播。
另一方面,通过从视频中学习,也能更进一步地识别检测恶意非主流价值观的言论,达到净化社交空间的目的。但也不可否认,在理解视频语言,转化语音文本的同时,囿于用户、视频资源等自身属性——譬如噪音、视频角色转化等问题,从视频中学习系统也必然存在一定程度的识别难度,鉴于这种难度,可能就此造成识别上的歧义。直白讲,也就是它并不能百分百等同于人脑的辨识。虽然无限接近,但并不等同。
此外i,Facebook 还表示,机器学习的未来,应用前景非常广阔,它甚至会影响到我们生活的角角落落。诚然,能够理解视频内容、思想的人工智能可以让 Facebook 更好地洞察用户们的生活习惯、爱好兴趣,以及思维方式等等。建立在对用户有着足够多、多维度了解的基础上,就能匹配给用户相应的视频内容,这个过程也是一种价值观念的植入,是思想情绪的引导。通过以上种种方式,带给用户全新的体验。
(来源:Pixabay)
当然,这个过程也是用户赚取收益与创作者内容生产的双向进行。在搭建良好的社交空间基础上,依托庞大的数据支持精准地服务用户,完善推荐机制,实现内容创作者在生产内容的同时,也能通过投放广告,实现收入多元化。机器学习,也就是作为一种成长赚钱的支持工具的存在。
关于从视频中学习这一项目,虽然 Facebook 拥有数以十亿计的视频、照片资源,但在涉及隐私问题上,当被问及在没有征得用户同意、以及用户不知情的情形下而将自己的视频和创作内容用于 Facebook 的人工智能训练时,Facebook 并没有清晰的态度,只是含糊其辞,一带而过。仅仅是简单回应:公司的目的只是抓取数据通过用户所上传的内容进行研发测试。也有相关声音提问出,对于Facebook 到底会抓取多少用户的视频进行测试其 AI 系统,如何监督该公司研究人员对视频数据的提取访问,依然没有正面回应。