大数据数据库_阿里云_物联网解决方案

时间:2021-04-09 04:05来源:简淘客云作者:简淘客云点击:

导读:
扫描关注公众号

大数据数据库_阿里云_物联网解决方案

"我们相信幸福始于真正的自我,"Whisper的首席技术官乌拉斯巴达克(Ulas Bardak)说这就是我们区别于其他平台的原因。我们非常注重真实性。"你很少听到首席技术官关注他希望用户感受的方式。CTO通常专注于技术方面的事情,比如数据和机器学习。但是,当为每月3000万活跃用户设计一个社交平台时,考虑到算法如何创建一个安全和包容的网络,与Whisper的目的密不可分。位于洛杉矶"硅谷海滩"的一家媒体公司Whisper拥有最大的在线平台,人们可以在这个平台上分享真诚的感受,并在分享的话题上找到联系——没有身份或个人资料。在他们的应用程序中,用户输入一个想法或告白,并借助Whisper的图像和视频匹配技术,构建带有情感背景和视频片段的动态模因。每天有超过50万条"耳语"被创建出来,Whisper的内部编辑团队被赋予必要的构建块来包装和策划网络上一些最容易点击、最易受攻击、最吸引人的故事。但事实证明,Whisper帮助人们成为他们的"真实自我"是一个背后有一台机器的使命。即机器学习。从内容创建策略到数据科学、工程和产品团队,机器学习是Whisper整个运营的基础。它的算法和深度学习计划不仅帮助Whisper与Facebook、Snapchat、Tumblr和其他社交和新闻网络争夺眼球,还帮助Whisper跨平台扩展到数百万不同的用户群,并在此过程中建立富有表现力的在线社区。悄悄地说,机器学习并不像许多人担心的那样是媒体的大坏蛋,用机器人取代编辑人员。事实上,Whisper认为机器学习是媒体革新的源泉。对他们来说,机器学习是一种工具,可以在其人力资源编辑团队的要求下工作,并建立一份反映其服务社区的出版物。 从其内容审核系统,到发现缺陷并跟踪数百个决定工程和产品优先级的指标,Ulas分享了Whisper是为数不多的几家尝试机器学习的媒体公司之一,而不是取代机器学习,而是帮助其编辑团队达到雄心勃勃的读者群目标并培养紧密的社区。承诺和陷阱在当今的注意力经济时代,出版物和在线社区正在寻求机器学习来帮助创造、自动化和个性化的个人阅读体验。例如,《纽约时报》利用数据科学来推动其读者战略与编辑人员的合作。然而,没有比Facebook在2016年8月发生的事情更能说明媒体机器学习的承诺和缺陷了。 当这家社交网络被传闻对倾向保守的新闻有偏见时,Facebook解雇了其趋势功能背后的人工编辑,以确保"没有证据表明存在系统性偏见"。当Facebook的人工编辑被一种算法所取代时,新闻业最可怕的恐惧便浮出水面:作家和编辑总有一天会被软件取代。 但事实证明,扎克做了一个错误的选择。这个算法是一个劣质的算法,72小时后,它推广的是虚假和低质量的故事。很明显,尽管软件在过去几年里取得了进步,但有些工作离不开人类的推理。今天,人们又以一些方式参与潮流,正如Ars Technica报道的那样,他们会做一些基本的,但非常重要的事情,立返利,比如"确认一个话题与现实世界中当前的新闻事件有关"除了政治和技术上的混乱之外,这场趋势性的惨败也是整个传媒业的一个教训。当然,算法可以帮助对内容进行分类并提供大规模的建议,但是有些决策离不开人类的协作。这就是为什么Whisper依赖于一种混合解决方案的关键原因,即机器学习与它的人类节制和编辑团队并肩协作。 xyz公司自动仲裁为了鼓励用户生成的内容,即互联网大规模泄露其秘密,Whisper需要开发一个自动化的决策系统,以跟上其不断增长和活跃的社区的步伐,同时确保对其内容的质量控制。乌拉斯说:"当《窃窃私语》刚起步的时候,我们有一个人性化的团队,在创作的时候挑选和管理这些微语帖子。"。然而,随着Whisper越来越受欢迎,每天都有新的内容在病毒式的水平上被创建,这对公司来说变得非常明显,他们无法跟踪所有的内容。乌拉斯说:"当然,我们可以继续为适度团队雇佣更多的人,但有一个更具可扩展性的解决方案。"。仲裁者是该公司众多机器学习工具之一,大数据包括哪些内容,它可以破译哪些内容是"安全的",哪些内容需要过滤掉,哪些内容需要由人工主持者进行审查。仲裁人对每天创建的50多万条耳语中的70%进行仲裁,剩下的内容由仲裁团队进行审查。在这一点上,Whisper的编辑团队挑选出最吸引人的Whisper,并制作出数千篇读者喜爱的文章和视频,然后在公司网站和社交网站上发布。乌拉斯说:"这种深度学习系统帮助我们管理和分类每天产生的数十万条新的耳语。"。然而,在一开始,仲裁者并不像设置一些基本规则来遵循和自动化那么简单。 "人类语言是一个非常复杂的东西,"乌拉斯说这就是自然语言处理存在的原因,对吧?你不能只写下10条规则就希望抓住所有这些潜在的问题。"Ulas的团队在开发仲裁者时学到的是,媒体公司的算法远比回答一系列简单的是或否问题复杂得多。该团队知道,如果仲裁者的程序设计过于激进,那么它将删除大量好的内容,从而使他们成功所需的高参与度面临风险。然而,如果酒吧过于宽大,云服务器和服务器,那么Whisper就有可能让不合适的材料被发布,并疏远用户。乌拉斯说:"我们希望确保正在创作的内容是安全的,以便创造一个积极的地方,让人们可以分享他们真诚的想法和感受。"。考虑到Whisper的许多意见可能是带有讽刺意味或是需要更大的文化背景,人性化的观点是至关重要的。乌拉斯说:"在处理细微和有点混乱的内容时,使用神经网络是我们的最佳选择。"。正如他所解释的那样,计算机中的神经网络是按照大脑的工作方式建立的。""在Whisper的例子中,这种联系网络跨越了数以百万计的人类机密内容实例,我们当时就能够训练出这些内容的仲裁者,"他继续说道在我们编写算法时,我们已经从所有以前的人类调节者那里获得了足够的训练数据,以便使用深度学习技术。"如果仲裁人认为没有人应该看到窃窃私语,它将被从平台上移除。但是,如果文本太复杂,并且算法无法确定正确的分类方式,人类节制团队就要权衡了。"深度学习的一点是,如果你有足够好的数据,它会非常有效。"通常情况下,这相当于数十万到数百万个实例,"乌拉斯说我们有数以百万计的耳语被我们的人类主持人标记为好的或坏的。基于这些数据,我们能够构建和试验仲裁者的不同基础设施。"不过,丰富的数据集只是第一步。如今,仲裁者被用于内容调节,但在未来,Whisper设想其机器学习技术将在故事和视频创作中发挥更积极的作用。虽然这种自动化水平仍在进行中,但Whisper的机器学习计划已经超出了仲裁者的范围。而这正是其增长的关键所在,Whisper之所以能够成功地扩展并支持每月超过3000万的活跃用户,怎么做淘客,很大程度上也是因为数据科学是Whisper整个运营不可或缺的一层。除了内容调整,算法还服务于产品、工程和支持团队。 数据作为燃料"传统上,数据科学将是自己的小团队,可能为公司的其他部门提供服务,"Ulas说但在我们的案例中,我们有专门的数据科学家专注于产品的每一个特性。他们既参与了工程基础设施的开发,返利app是真的吗,也参与了为支持这一目标而可能需要构建的任何基础设施的开发。"在围绕数据科学资源构建每个团队时,机器学习已成为每个团队的燃料来源。"每周我们都会召开稳定性会议,我会坐下来看看我们跟踪的数百个指标,包括用户参与度和基础设施健康指标,以及直接从应用程序和谷歌Play商店获取的用户满意度数据,"Ulas说。 在坚持产品路线图确定的工程和产品优先级的同时,团队还依赖于峰值或下降趋势线来确定最迫切需要解决的问题。"异常和趋势对我们来说是一个很好的指导,可以让我们在未来一周将工作重点放在某些产品或功能的稳定性方面,"Ulas解释道。从调整和分类内容到跟踪产品和工程指标,数据是Whisper作为一个组织做出的所有决策的关键。事实上,算法甚至有助于乌拉斯的管理风格:"我已经编程了一个算法来帮助我安排不同的一对一的会议

最新文章
推荐文章

热门标签

联网 数据 阿里

友情链接Early childhood

云计算产品_ucloud数据库云主机_国内数据文件储存云平台-简淘客云

Copyright © 2002-2019 简淘客云 版权所有 备案号:豫ICP备xxxxxxxx号

声明: 本站文章均来自互联网,不代表本站观点 如有异议 请与本站联系 本站为非赢利性网站 不接受任何赞助和广告