“一个外国小哥测试Google,先打开各个网页,都是常规广告,聊了两分钟dog toys后打开网页后基本都是dog toys广告”、“女票大喊妈妈明天买玉米,购物平台推荐玉米商品照片”……近日,有媒体称耗时3个月测试发现多款APP疑似“窃听”用户对话,从而精准推荐相关产品,随后大量网友跟进描述自己相似的经历,进而引发外界对于APP“监听”的质疑。
目前,包括BAT和饿了么、美团、今日头条等各大平台都做了回应,悉数表示不可能、不存在。其中,百度回应称:百度App不会、也没有能力“监听电话”。阿里巴巴回应称:以前不会这么做,以后也不会这么做,保护用户隐私是阿里巴巴的生命线,绝不会采取不合法、不合规的手段采集使用用户信息。
对此,记者采访多名资深技术专家,从技术门槛、语义分析成本等角度深入剖析,最终达成的共识是:APP通过语音获取用户信息,进而转化成商品推荐,技术及商业成本均太高,对于企业来说,并无使用的驱动力,因此,“监听”明显是个伪命题。
APP被质疑“监听”但并无实锤
实际上,手机APP“窃听”的说法并不是第一次出现。早在2016年,英国《独立报》就曾报道称,怀疑用户量巨大的FACEBOOK通过手机“监听”用户说话,从而达到广告精准推荐的作用。
随后2018年初,今日头条、百度等国内互联网公司相继被爆出APP“监听”用户的情况,不过随后这些公司也都相继进行澄清,称绝不会在用户不知情的情况下收集用户隐私数据,以及语音等敏感权限均需授权,且用户可自由关闭。
不过这些质疑声中,大部分都是用户捕风捉影般的猜测,比如“我刚说过小时候的动画片,打开微信广告就给我推荐变形金钢”,“昨天在商场买了一套茶具,今天就给我推送差不多的”……因没有真正的实锤,舆论也很快消解。
此次“监听门”事件中,网络安全团队网络尖刀负责人曲子龙进行了一次实验:在安卓系统中内置一个模拟APP程序,可获取曲子龙的讲话内容,并传输给后台服务器转化成文字信息。
“单纯的语音监听技术10多年前的手机木马就可以实现,现在多了语音识别技术,该测试中使用的NLP(即自然语言处理技术)技术也很成熟,但并不能验证其他APP通过这一方式‘窃听’用户。”国内某知名反病毒软件公司一位安全技术专家在接受采访时表示。
换言之,语音收集转化成文字的技术很成熟,但与APP“监听”关系不大,这也是记者采访多名技术专家得到的一致结果。
“科学的方法应该是做软件行为分析和数据流量分析,通过监控录音接口直接查看APP的流量调用情况,而不是通过用户聊天测试这种不科学的方式,”知名安全专家李铁军举例称,在一个投放级别触及千万网民的场景中,只搞两三部手机做一个统计测试,就好比问1000万中国人中的两三个人是爱吃米饭还是爱吃馒头,然后,很快得出的结论就是这1000万个人个个都爱吃馒头。
从3年前亚马逊被要求提供Echo音箱数据、智能电视窃听传闻等,质疑声一直未断绝。李铁军认为,至今全世界没有任何一个安全厂商的研究人员分析出某个中国商业公司的APP在干着偷听用户谈话这回事,“目前的话题略显夸张。”
成本太高“监听”明显是伪命题
此次“监听”事件中,除了大量用户身上发生的“我刚说过,APP就推荐”等非科学类的猜测之外,人们对于互联网企业的另一个指摘在于:出于商业利益,公司有需求、有动力去“监听”用户,但事实确实如此吗?
不考虑其他商业因素,单纯从技术成本角度来看,很多资深技术专家认为商业公司并没有驱动力去“监听”用户。一位业内专家粗略估算了一个成本数据:第一,流量成本,手机用户的声音首先需要传输到服务器上去处理,即使压缩之后再传输每天只采集8小时,大概每天的流量消耗至少也是50兆,一个月下来就是1.5G,用户不会公司也不愿意去为这1.5G每月的流量买单;第二,收集回来的语音需要转化成内容、数据进行分析才有价值,单个用户8小时的语音去调用各种复杂机器学习模型,声音转文字、语义分析、意图判别,光是服务器上的计算和机器成本,摊下来每天都至少2.6元,3亿用户一年的花费就是3000多亿元。
杭州指令集公司CTO宋杨分析指出,APP是否“监听”,从成本、风险和收益三个视角就可以得到直观的判断,“如果APP在本地做语音监听分析,很容易就会被逆向分析等技术手段抓到小辫子,风险非常高;反过来如果全部通过云端处理,则会消耗高额的流量和服务器成本,同样也很容易被人质疑,并且会带来糟糕的用户体验。”
宋杨同时还表示,无论是在线上还是线下,隐私和数据安全都是非常重要的一环。未来操作系统的演化也应该在这方面加强控制,防“君子”的同时也要防“小人”。
与此同时,业内专家指出,“监听”也会损耗大量的用户手机电池功耗,必须在手机上进行声音的转文字和各种机器学习模型分析,“手机上的芯片现在去跑负责机器学习模型一来是慢得很,二来是电池功耗也会显著提升,不在充电状态下,手机电池的电可能很快就用完了。”
“以用户使用半天手机来计算,这一过程产生的数据仅在美国就有20PB,是Facebook每天处理数据的33倍还要多,”一位Facebook广告部工程师Antonio García Martínez此前在《连线》杂志上撰文指出,想从谈话中获取关键词,还需要在手机上将语音转换成文本进行识别,“整个过程的功耗巨大,就是算iPhone X,分分钟也得变成砖。”
此外,有多名安全专家指出,“监听”的手段多用于被黑客攻击或其他特殊情况,单个监听木马的成本在十几万左右,目前在民用市场不可能看到类似产品,“十年前塞班时代有‘手机窃听木马’,到5年前‘宝贝监控’的手机病毒,在安卓和iOS日趋完善的系统安全环境下,这类‘监听’木马一出现就会被杀毒,更不可能大规模应用。”
“而最根本的原因,用户大量的语音其实是无效数据,对广告商来说没多大价值。” Antonio García Martínez在文章中指出。