AI驱动的内容检测永远不会是完美的

本文摘要:来自监管部门的压力,拒绝更好地倚赖自动化来展开内容移除,这有可能会巩固网络空间的合法性。由“民主与科技中心(CenterforDemocracyandTechnology)”在布鲁塞尔主办的小组讨论会中,我描写了AI驱动的内容检测技术的功能和局限性。

lol外围

来自监管部门的压力,拒绝更好地倚赖自动化来展开内容移除,这有可能会巩固网络空间的合法性。由“民主与科技中心(CenterforDemocracyandTechnology)”在布鲁塞尔主办的小组讨论会中,我描写了AI驱动的内容检测技术的功能和局限性。其他小组成员还包括现在就任于标普全球公司(S&PGlobal)的ArminehNourbakhsh,她描写了在路透社帮助研发的Tracer工具,然后在“民主与科技中心”就任的EmmaLlansó描写了她最近参予年出版的论文《混合信息?自动社交媒体内容分析的局限性》。

来自欧盟委员会的PrabhatAgarwal明确提出了一个富裕洞察力的决策者观点。各平台和其他互联网参与者用于自动程序对其系统上的非法内容展开处置,如仇恨言论或恐怖主义内容。他们还用于完全相同的技术来拒绝其用户强制执行自己的强迫服务条款,以确保网络环境的稳定性和吸引力。

最后,有一种中间类型的内容,它不仅不更有人,本身并不几乎违法,但它是危害的,必须加以控制。欺诈消息传播活动就归属于这一类。

来自政府的压力拒绝用于自动化系统,这一情况日益增长现在我们辩论将这些内容自动移除的原因某种程度是在技术上的。政策制定者十分注目用作内容检测的系统的有效性,并且正在推展平台来做到更加多的工作。有时这不会渗透到监管的法规拒绝中。

最近欧盟宣告的避免网上恐怖主义内容的全面推行条例就是一个很好的例子。人们十分注目于该条例,其容许欧盟成员国的国家主管机关来拒绝各个平台在接到通报后一小时内移除特定的恐怖主义内容。

但更加令人担忧的是,该条例拒绝各平台采行“主动措施”,以便从一开始就避免恐怖主义内容经常出现在平台上。由于主动措施是一些针对恐怖主义内容的自动屏蔽系统,因此该全面推行条例显著巩固了当前电子商务指令的效力,以强迫监测系统担负起监督恐怖主义内容。更加差劲的是,如果某一家公司接到过多的移除指令,却无法与监管机构所设计的改良目标达成协议完全一致,则该公司有可能必须部署和确保监管机构所登录的某个自动内容移除系统。必须采行保护措施以使内容移除要求显得公平内容移除要求必需有具体的标准,这些标准必需半透明,以便用户对超出范围和可拒绝接受范围能构成预期。

此外,必须对单个内容移除要求展开说明,这一要求不应解释启动时该要求的内容的特定特征或方面。最后,因为没一个系统是极致的,所以必须一个解决问题机制,以便在内容被错误移除后需要完全恢复。作为一个榜样,请求想到美国信贷业的作法,他们数代人将这些透明度、说明解释和解决问题机制带入其工作中。

出于EmmaLlansó在她的论文中阐述的原因,全然依赖自动化系统展开内容移除是错误的。由于错误率太高,所以一直必须人工审查以保证在内容移除之前充分考虑其内容的上下文和含义。这些自动化系统具备大力且有益的起到首先,这些系统可用作十分明确和有价值的目的。

Armineh说,由路透社研发的Tracer系统可扫瞄Twitter以找到一些脑溢血新闻故事,并将其传送给路透社的编辑和记者展开审查。该系统可检测到大多数(但并非全部)的欺诈谣言和蓄意误导内容,并只传送这些近于有可能具备新闻价值的内容,从而使记者需要更加有效地工作。然而,即使在路透社,也必须采行保护措施,以防止例如特定来源或用户的信息被分析。第二个最重要用途是检验有可能必须移除的内容。

当系统在现代社交网络的范围内运营时,对所有潜在危害内容展开人工审查是显然不有可能的。自动化系统可以获取一个可管理的问题内容列表,以供人工稿件者来确认否移除。最后,自动系统可以十分有效地避免上载那些先前已被辨识并移除的内容。

该模型可有效地应用于儿童色情图片,并通过一个自动内容识别系统来避免予以许可来上载不受版权保护的内容。行进的道路上我们可采行公私合作伙伴关系对于自动内容移除的忧虑并不意味著不会巩固从在线系统中移除危险性内容的一般性主张,鉴于恐怖主义的相当严重挑战,移除危险性内容是一个十分严峻的问题。

但是,我们必需着眼未来以及我们的迫切需要,并不应慎重创建确保措施,以避免在十分有所不同的政治环境中欺诈任何新的监管权力,而在这种情况下,风险有可能是来自政府机构的过度介入。在行进的道路上我们要认识到,所面临的问题要比技术更加相当严重。恐怖主义事件来自技术行业没构成且无法自行提高的基础社会、政治和经济过程中。

但是,他们的体系不应当被用来使问题显得更糟,他们的内容移除工作将从公私合作伙伴关系中获益,这种公私合作关系依赖政府获取信息和赏识以及开会行业参与者来制订和实行行业最佳实践中。然而,一个根本性的危险性是政策制定者或许不愿忽略错误的实际成本,很显著,他们指出,只要能顺利地移除危险性内容,犯错误就是有一点的。

却是,他们或许指出,各平台总能完全恢复那些因错误而被移除的内容。这种观点忽略了许多在线交流内容的时效性,在这种情况下,花费几周甚至几天后所完全恢复的内容是毫无意义的。而且,所牵涉到的错误范围很更容易被高估。数十亿次用于中的一个较小的错误率有可能意味著不是数百,不是数千,而是数亿次的错误。

综合一起,随着时间的流逝,这个错误的量级将伤害这些体系的可信性和合法性,使其丧失多种合法政治话语权的益处。


本文关键词:lol外围,驱动,的,内容,检测,永远,不会,是,完,美的

本文来源:lol外围-www.zzjcgs.com