| | | 2017年11月17日 星期五
XR5
文汇学人;专题

数据的使用者当怀敬畏之心


带着队伍跋山涉水的日子,一直印在何青心里。
回传数据是调查员晚上的必修课,不管多晚,不管他们身在哪里。
为了赢得受访者的好感和采访机会,何青带着小伙子们帮受访者推起车来。

    本报记者 刘迪

    2011年,博士一年级的何青成为了第一批中国家庭金融调查的访员督导。那一年,这个瘦瘦高高的大男孩带着自己的队伍“挺进大别山”。

    没有访员会质疑体能的重要性

    山里的人口密度不比外面,邻里之间常常隔着好几里的山路。虽说大山里的空气让人闻不出汽油的味道,可是山路上走着走着,却也总是会上气不接下气的。和“家金”任何一支调查队伍无异,何青手下的“兵”也是巾帼多于须眉。于是,他只好把大山最深处的那个受访户留给自己。吃过早饭,何青就背着干粮、矿泉水出发了,耳边只有老乡那句“沿着这个方向往上爬就到了”的指引。24岁的小伙子浑身上下都是使不完的力气,一路上,何青发现自己的影子越走越短,然后肚子就咕咕地叫了起来。他停下来啃两口面包,很快,内在的世界便又恢复了平静。太阳高高地悬在头顶,何青终于走进了受访户的家门。山里人家的社会关系相对简单很多,家庭金融状况更为明晰。 于是,很快何青就向受访者告辞,下山了。

    2013年4月,何青作为绘图员来到了福建,虽说绘图员的工作少去了 “叩门”的“公关”挑战。但是,“大调查”对于绘图员的要求却是十分具体的,绘图员要标明一桩大楼里每一个入户门的准确位置。别以为只要摸清了底楼的门户分布,楼上只剩简单的复制与粘贴。很多时候,最具欺骗性的便是看似稳定的规律之下暗藏的变化。于是,不管几层还是几十层的楼宇,绘图员都必须逐层亲自走到、看到、确认到,没有电梯的就爬上去。唯有如此,绘图工作才能够为后续调查员入户提供精准的参考信息。每每这个时候,都不曾有人质疑体能的重要性。

    何青曾画过莆田一个村落的农舍分布,图画好了,却惊到了身边的明眼人:“这不就是八卦图吗?” 起初,何青还常常惊叹于各种“没想到”与“想不到”,后来路走得多了,便渐渐习惯了万里路上的林林总总,淡定了许多。

    有种辛苦,叫做晒不到太阳

    七八月的天从来都由着性子,遮阳帽、遮阳伞下,姑娘的脸蛋涨得通红,小伙子的肤色则常常比古铜色还要深两个色号,让人见了心疼。有了台前,自然少不了幕后。对于“大调查”而言,后勤保障、技术支持、质量控制、数据清理、新闻报道等等,个个都是少不了、离不开的“狠”角色。“有求必应”永远是前方冲锋陷阵者对于大后方的“基本”要求。于是,加班、加点、熬通宵便成为了他们的夏天。有种辛苦,叫做晒不到太阳。

    2017年,何青终于完成了从台前到幕后的转身,成为了“大调查”的质控负责人。走进质控实验室,入耳的只有键盘和鼠标的敲击声。200余名质控员端坐在各自的显示器前,头戴式耳机下包裹着一张张若有所思的脸。他们正逐字逐句“监听”每一个访问的录音记录,对照问卷核实前方调查员回传的数据。一套样本中,如果样本数据中“拒绝回答”或 回答“不知道”的频率过高、奇异值过多、样本访问时间过短等,都会被质控人员标记为异常样本,等待它们的将是更为严格的进一步审核。

    “你走到哪我就静静地跟到哪”

    何青是调查员出身,没有人比他更清楚每一个数据的来之不易。“每次要舍弃一个数据,对于我而言都是非常痛苦的。”所以他要求质控人员必须对自己做出的每一个判断负责任,“因为前方访员敲开每一扇门所付出的辛苦,必须得到应有的尊重。”

    刚刚过去的这个夏天是王宁翼本科升硕士研究生的间歇。在这段特别的日子里,她选择加入“大调查”,成为了一名质控员。被问及为何不去一线做访员,宁翼的回答干脆而率真—— “只是不想被晒黑”, 字间装满了姑娘的小心思。

    每个早晨,王宁翼的个人文件夹里都会塞满当天的工作任务。通常情况,上午、下午各须审听两个样本录音,审核一个样本录音的时长都在两个小时左右。受到采访环境的限制,录音里常常伴随着汽车驶过的声音、机器运转的声音、人们闲聊的声音,甚至狗叫的声音。对于质控员而言,耳机一旦扣在了耳朵上,常常是五六个小时摘不下来。这一天,宁翼审听的一段访问是在工厂里完成的,背景音十分嘈杂。两三个小时听下来,宁翼只觉得头昏脑胀,连午饭的胃口都没有了。

    质控这活儿确实不会把人晒黑,却也是极其磨练心性的。

    说起在工厂里访问,何青一点也不觉得意外:“很多时候,访问就是抓住受访者的时间碎片完成的。”曾经还有调查员索性跳上受访者驾驶的大货车,“你走到哪我就静静地跟到哪,反正你总归会有休息的时间,我就见缝插针地访问”。

    在质量控制的范畴内,区别于“核样”,还有一个名词叫做“换样”。例如,“家金”条例明确规定,访员6次上门无人应答(上门时刻需间隔3个小时以上),则可申请换样。“事实上,访员的上门次数通常远远超过6次,因为没有访员希望换样。”何青如是说。其中的道理并不难理解,因为“核样”增加了访员的心理压力,“换样”同样可能为调查带来不确定性和额外的工作量,因为没有人知道新的样本会在哪里。在村镇间,邻里原本居住得就相对分散,加之路途不便,缺少交通工具,换个样本常常会多消耗一组访员(两个人)半天的工作量。

上海报业集团 版权所有