Seth Stephens-Davidowitz《數據、謊言與真相:Google資料分析師用大數據揭露人們的真面目》(Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are),陳琇玲譯,台北﹕商周,2017
這本書一開始某個地方碰巧見到的。好奇下就拿來看看,驚覺內容實在厲害,更奇怪為何在下沒一早發現這本書,書海之大總有漏網之魚。
怱怱之下只能草草揭過,由於出版一段時日,已很難再買到紙本書了,於是就買電子版自己讀完它。
為何吸引﹖因為第一篇就告訴你甚麼叫「智者見於未萌」。只要你懂得找,大數據早就告訴你奧巴馬勝出大選不代表美國的種族歧視有根本改善,甚至早已暗藏侵帝當選的種子。
看看目錄,如果對甚麼造就NBA球星沒有興趣,大眾的「性觀念」總會令人感興趣吧﹖人們平時會說謊,在Google搜尋卻會透露心底所想,可以作為一種替代的社會調查。當然方某認為這種調查方式亦有其不足之處(見筆記),可是與傳統調查,足可相補。我們從中可見到人們平時收在暗處的想法,而了解這些想法有助我們制訂更好的社會政策。
而這些利用大數據的商業調整,亦令我們深陷於演算法編織的羅網中,不能自拔。間接加劇了社會的問題。
作者除了提出很多「大數據」可以導致的問題,也提醒大家不要「迷信」大數據。就算在學界或業界,都有很多人只顧「鬥大」(比較自己數據集的大小),而忘記了提出獨到的問題才是精彩所在,作者引用的研究(包括他自己的那些),所用的數據其實並不太大(當然跟我們一般人接觸到的相比仍是「大數據」,例如Google搜尋紀錄,就算他們是先抽樣後分析而非使用「整個」資料庫,實際上仍是很巨大的),他們只是用上新穎的方式,去解答有趣的問題。
由此可見,就算在大數據甚至人工智能的時代,人的智慧和創意仍然十分重要。
(如果閣下有興趣讀電子書,經本文連結 https://moo.im/a/8acfPT 購買,本人將獲得平台回饋。當然看倌不一定要經這條連結買的。)
---
筆記,或挑骨頭﹕
#10 推薦序「擁有海量數據並不會自動產生精闢結論。「垃圾進,垃圾出」(Garbage in, garbage out)是所有曾學過統計的人致力避免的錯誤。」
這點我反而最早是在電腦科學到。電腦甚麼都可以算,你餵一堆垃圾給它,它照樣會幫你計算(反正只是按演算法搬動數字而已),但出來的也是垃圾而你會當寶。
#20 「統計學與邏輯告訴我們,觀察到「現象」,未必等於掌握「真相」,更不等於理解「原因」。研究人類行為和社會現象,質性的觀察、歸納與演繹仍然不可或缺。」
這就是人的價值。
#43 「當樣本是透過便利方式蒐集,一切就變得更不確定,比方說,我們為了取得樣本,在課堂中給大二學生一點小錢買啤酒。」
喜歡飲啤酒或者貪小便宜的人,不一定代表到整體。
#112 前言「數據清楚顯示,在美國針對種族主義進行大量搜尋的地區,歐巴馬的得票率大幅輸給四年前民主黨白人總統候選人約翰.凱利(John Kerry)。跟這些地區有關的任何其他因素,包括教育水準、年齡、教會出席率或槍枝擁有權,都無法解釋這項關係。種族主義的搜尋並未預測民主黨其他候選人的低得票率,唯獨歐巴馬例外。這項結果意味著一個巨大的影響。單就種族主義這個因素,大概就讓歐巴馬的全國得票率少掉四個百分點,這項數字遠高於依據任何調查所做的預測。」
到拜登那次沒種族因素左右,侵帝輸了就唯有信口開河說對方選舉舞弊了。
#122 「甚至有跡象顯示,原先表示還沒決定投誰的選民,最後會投給川普。我跟加布利爾發現,在預期希拉蕊會贏的中西部地區關鍵州,「川普 柯林頓」的搜尋比「柯林頓 川普」的搜尋來得多。後來事實證明,川普當選是因為他在這些州的得票率,遠超過民調預期。……搜尋數據顯示,我們所居住的社會,跟仰賴民調的學者和記者所以為的社會截然不同。這透露出一個令人不悅、可怕和廣泛的憤怒,正有待候選人宣洩出來。」
有趣在他們敢做不敢認,如果自以為投侵是正確的,何須否認﹖
#148 「本書討論的某些研究根本沒有使用龐大的數據集,只是運用一種創意十足的新穎方法處理數據,這類方法在資訊氾濫的時代裡至關重要。」
#207 「談話的重點是你可以累積多少資訊,而不是你希望利用資訊做些什麼,或是你打算利用資訊回答什麼問題。「當時我發現,這種情況實在很有趣」弗里德曼說」
「我相信數據集的大小常被高估,對此,有一個微妙卻重要的解釋:效果愈大,所需觀察的次數就愈少。一個熱騰騰的爐子,你只需要碰觸過一次,就明白熱爐子很危險,但你可能需要喝幾千杯咖啡,才能確定喝咖啡是否會讓你頭痛。哪一種教訓更重要?」
「最重要的是,為了從大數據中取得洞察力,你必須提出正確的問題。」
Size does not matter
#185 「你可能認為種族主義的主要原因是經濟上的不安全感和脆弱。你當然會懷疑,人們失業時,種族主義的情況會更嚴重。但實際上,無論是跟種族主義有關的搜尋或是風暴前線網站的成員人數,都沒有隨著失業率上升而增加。」
但種族主義是否像失業率那麼浮動﹖我很懷疑。
即是你今天失業了,於是明天(或者下星期)就仇視其他種裔﹖恐怕不會這樣。我想更有可能的是,你一直活在(甚至成長於)就業不穩的環境,會令你更易傾向種族主義,認為其他人搶走工作。
可能作者要比較很長時期的數據才能檢視這點。
#312 第一章「有效的數據科學不像人們想像得那麼複雜。事實上,最優秀的數據科學是非常直觀的。」
最好的當然通常簡單。(問題是沒那麼多「最好」)
#354 「最近分析史上針對人類關係所蒐集的最大數據集——臉書。他們觀察許多情侶的交往狀態,其中有些情侶表明自己在「交往中」,有些情侶則將自己的狀態改為「單身」。研究人員發現,擁有一群共同好友,反而是關係不會持續下去的一個強有力預測。」
我反而有點懷疑,因為很多人的臉書朋友和現實朋友未必一樣。這個研究充其量只是說明「在臉書上」的共同朋友多對感情沒好處。
(當然在下「所有」交往過或試圖交往的對象—包括老婆—其實都是在朋友圈子中,所以必然有共同朋友。但是在下交往次數太少,自然無法說明甚麼。)
「一般人都認為,在貧困環境下長大,也許由十幾歲未婚媽媽辛苦扶養的環境,有助於培養在這種競爭激烈運動比賽中達到頂尖水準所需的驅動力。」
其實通常都不會是,因為家境貧窮只會令你更難專心訓練,你經常要擔心家裡有沒有飯吃、能否交到學費、家人大病沒有錢醫,甚至因此放棄追夢。只是人們比較容易注意到貧家孩子成名的故事。
#371 「弗萊爾和李維特研究一九八○年代加州的出生證明發現,在非裔美國人中,貧窮未受過教育的單身媽媽往往會給自己小孩取很特別的名字,跟中產階級受過教育的已婚雙親會為小孩取的名字不同。」
為何﹖因為少讀書﹖還是因為愛標奇立異﹖
#391 「沒有一項數據來源是完美的,但三者都支持同樣的說法。更好的社經地位表示更有可能成為NBA球員。」
所謂「交叉比對」的威力。
#412 「出身貧困的男孩比較難成為NBA球員的第二個原因是,他們有時缺乏某些社交技能。經濟學家利用幾千名學童的數據發現,平均來看,中產階級雙親家庭比較擅長教養出容易相信別人、有紀律、堅持不懈、專注並具備組織力的小孩。」
其實這效果更有可能是遺傳導致。正如一些研究指出,教養對子女性格的影響很小。
「喬丹被退學後,媽媽就帶著他一起上班。媽媽不准他離開車裡,要他待在停車場坐在車子裡看書。他被選入芝加哥公牛隊後,爸媽和兄弟姐妹輪流來看他,以確保他不會受到名利和金錢所惑。」
想想家庭要有多寬裕才可以全家一起看顧他﹖在窮家庭各人只會自顧不暇。
#436 「數據告訴我們,在貧困家庭和貧窮社區裡,確實有具備NBA水準的人才,但是這些人卻進不了NBA。這些男性有天分也有抱負,卻從來沒有發展出成為籃球超級巨星的性格。」
不完全是歧視,卻是一種階級複製。
#551 第二章「是什麼原因讓我們夢到食物?主要的預測因素是,我們多常食用這些食物。人們最常夢到的物質是水。最常夢到的二十種食物包括:雞肉、麵包、三明治和米飯,這些食物顯然不像佛洛伊德所說,夢境中的事物都有性意涵。」
我反而少夢見食物,可能我真的對食物太沒興趣。
#577 「佛洛伊德的所有理論都徹底偏離目標嗎?不完全是這樣。我剛開始取用PornHub的數據時,發現一件出乎意料的事,而那件事就跟佛洛伊德有一點關係。事實上,這是我在進行數據調查時發現最驚人的事情之一:造訪主流色情網站搜尋亂倫影片的人數高得嚇人。」
其實看日本AV標題就知道。
但可能只是挑戰禁忌的主題特別令人起興趣(反正正經電影也經常出現一般人無法做的事,例如拯救地球或者打仗殺敵),正如很多人習慣把性器官掛在口邊(粗口/國罵),不代表他們對性行為有異乎常人的興趣。看AV的人,喜歡看別人演出某些情節,不等於他自己想在現實做出來。(留意﹕想不想,跟能不能做或做不做得到是兩回事。)
#586 「這類搜尋並非特別常見:在美國,每年有幾千人承認自己有戀母情結。而且,必須有人讓佛洛伊德知道事實的真相,如同本書後續的說明,Google搜尋的數據有時會偏向禁忌事項。」
為何搜尋會偏向禁忌事項,正因為作者使用Google研究人類的理由﹕他們覺得沒人知道自己問甚麼嘛。如果你的問題可以隨便向人問,你可能就會向現實生活中的人詢問,那就不用再Google。
「以男性在搜尋色情片時,最常搜尋的女性職業為例,十八到二十四歲男性最常搜尋褓姆,二十五到六十四歲男性也一樣,六十五歲以上男性也是。而對於各年齡層男性來說,老師和啦啦隊隊長都名列前四。顯然,早年生活似乎在男性性幻想中扮演著極大的角色。」
似乎是文化差異﹖日本和大中華區似乎沒特別喜愛褓姆和幼稚園老師(有這類作品但似乎沒特別多,當然方某只憑有限印象沒認真去數),日本AV大抵以中學老師為主角的片更多。
#868 第三章「如果一大堆人認為跟「比爾.柯林頓」有關的最重要連結是他的官方網站,那麼這個網站可能是大多數人搜尋「比爾.柯林頓」時要找的網站。」
簡言之,Google其實是用「民主」的方式決定搜尋結果排序。
#896 「剩下的三分之一將會罹患所謂的巴托比症候群(Bartleby Syndrome)。巴托比(Bartleby)是美國小說家赫爾曼.梅爾維爾(Herman Melville)精彩短篇故事中的書記員,他停止工作,對雇主提出的每一個請求,他都以「我寧願不要」來回應。許多馬匹在剛開始參加賽馬時,顯然就意識到如果自己不想跑就沒必要跑。」
想不到馬比人更早躺平。
#925 「他決定測量馬的內臟大小。由於現有技術不可能做到這一點,因此他設計出自己專屬的可攜式超音波設備,成效相當顯著。他發現心臟大小,尤其是左心室的大小,就是能否成為賽馬明星的關鍵預測因素,也是唯一最重要的變數。另一個重要器官是脾臟:脾臟小的馬根本無法在比賽中勝出。……一般來說,在談到賽馬時,塞德發現馬匹的左心室愈大愈好。但如果其他器官都很小,而左心室特別大,就可能是疾病的徵兆。」
#945 「第二個啟發是,試圖進行預測時,不需要太擔心你的模型為何有效。塞德無法徹底跟我解釋,為什麼左心室大小在預測馬匹成功時如此重要,他也無法準確說明脾臟的重要性。」
左心室尺寸大概是代表泵血到全身的能力,而脾臟是藏血器官,可能代表衝刺時補充血液的能力。
#925 「有些兩歲馬匹跑了八分之一哩後,會發出喘氣聲。這種馬有時賣到一百萬美元的價格,但塞德從數據得知,跑沒多久就發出喘氣聲的馬,不會是賽馬名駒」
這不需要數據吧﹖我就是跑兩下就喘氣的人呀。(笑)
「一般來說,在談到賽馬時,塞德發現馬匹的左心室愈大愈好。但如果其他器官都很小,而左心室特別大,就可能是疾病的徵兆」
左心室肥大,人亦然。
#1028 「當女性談論自己時,可能表示她對你感興趣。事實證明,對於一個想找對象的男人來說,你可以從女人口中聽到的最美麗字眼可能是「我」:這是女性感到自在的一個跡象」
在我經驗而言好像都沒甚麼用。
#1180 「經濟學家迅速歸納出一個關鍵因素:跟特定地區的政治風氣有關。如果整體來說,某個地區偏向民主自由,像費城和底特律這樣,那麼當地主要報紙往往偏向民主自由。如果某個地區比較保守,譬如蒙大拿州比林斯和德州阿馬利洛,那麼主要報紙往往會偏向保守言論。……當同一個人或公司在不同市場擁有報社時會發生什麼事,以紐約時報公司為例,它擁有根茲柯和夏皮洛發現偏自由言論的《紐約時報》,該報位於紐約市,而紐約市大概有七○%的人口是民主黨人。在進行這項研究時,紐約時報公司還在南卡羅來納州斯帕坦堡擁有保守傾向的《斯帕坦堡先驅報》(Spartanburg Herald-Journal),當地約有七○%的人口是共和黨人。……許多人,特別是馬克思主義者,認為美國新聞是由富人或企業掌控,目的是要影響群眾,也許是促使人們認同他們的政治觀點。然而根茲柯和夏皮洛的論文指出,這並不是媒體業主的首要動機。相反地,美國新聞界的業主們主要是提供群眾所需之物,這樣媒體才能有錢賺,業主才能變得更有錢。」
正是如此,例如肥佬黎固然有其個人政治取向,但《蘋果日報》能壯大,主要是因為他迎合了民主派讀者的需要。如果沒捧場客,他早就改口風甚至賣盤了。
(當然香港傳媒市場還被巨大的北方因素扭曲。「民主自由言論」有市場,但沒多少人敢賺這筆錢﹔反之保守言論可以幫老闆換取北方的利益,保守傳媒本身有多少人看、賺不賺錢、賺少了錢,都沒所謂。)
#1180-1195 「以結構化、明確簡單的調查式數據為主的那種日子已經結束。在這個新時代,我們在生活中留下的雜亂痕跡,正成為數據的主要來源。」
這點非常重要。
#1211 「在許多發展中國家,對國內生產總值(GDP)的現有評量效率不彰。這是因為大部分經濟活動的發生沒有官方記載,而衡量經濟產出的政府機構資源有限。這篇論文作者提出相當反傳統的構想嗎?他們可以根據這些國家的夜間照明,協助衡量國內生產總值。」
正如溫家寶看售電數據以了解地區經濟好壞。
#1367 第四章「即使大多數調查都是匿名,但人們還是希望保持自己的良好形象。這就是所謂的「社會期許偏誤」(social desirability bias)」
所謂誠其意者,毋自欺也。
「說謊肯定是民調無法預測出川普二○一六年會勝選的原因之一。平均而言,民調將川普支持率低估了二個百分點,有些人可能覺得尷尬不想表明自己打算支持川普,有些人可能聲稱自己還沒有決定要投誰,但心裡其實力挺川普到底。」
知恥仍為者,是無恥也。
#1453 「有壓倒性的證據顯示,絕大多數美國人告訴Google一些非常個人的事情,比方說,美國人搜尋「色情」多過搜尋「天氣」。」
某程度也因為天氣根本不用問Google。
(例如香港人,想知道天氣直接安裝天文台的app就好。)
#1467 「但有時候,我們將自己未經思索的想法輸入Google搜尋欄,並沒有抱太多希望認為Google能幫我們什麼,在這種情況下,搜尋窗口只是作為某種告解。」
不需要懺悔的時候,就只是樹洞。
#1481 「我的初步研究顯示,在某個特定州,同性婚姻支持率每提高二十個百分點,表示在臉書上公開自己是同志的該州男性人數就增加一.五倍。依照這種說法,我們可以估計在假設一○○%贊成同性戀的地方出生之男性,有多少人會公開承認自己是同志。我的估計是五%左右,這跟色情搜尋的數據相當一致。」
傳統說「十分一」只是個估計,但如果加上女同志戀者(假如跟男同性戀者一樣多,加起來後也只是總人口的5%)和其他性小眾可能會接近。
#1496 「我還沒有針對女同志人數進行估計。在這方面,色情片的數字比較派不上用場,因為女性觀看色情片的人數少得多,所以這種樣本比較不具代表性,而且就算觀看女同志色情片的女性,也不一定是女同志。在現實生活中主要被男性吸引的女性,似乎也喜歡看女同志色情片。女性在PornHub上觀看的影片中,有二○%是女同志影片。」
正如男人也會看女同志影片(所以女性看女同志片不代表是女同志),但反之男同志影片幾乎只有男同志會看。這點分別其實很值得研究。
「事實證明,老婆懷疑老公是同志,這種事經常發生。她們在次數多到驚人的「我老公是同志嗎?」這項搜尋中,表露出自己的懷疑。「我老公……」這類搜尋,就以「我老公是同志嗎?」的次數最高,出現次數比第二高的「我老公有外遇嗎?」多出一○%,也比「我老公酗酒嗎?」多八倍,比「我老公憂鬱嗎?」多十倍。最有說服力的是,在最不贊成同性戀的地區,女性對老公性傾向的相關搜尋最為常見。南卡羅來納州和路易斯安那州的女性,提出這個問題的比例最高。事實上,在最常提出這個問題的二十五個州當中,有二十一個州的同性婚姻支持率低於全國平均值。」
不出奇,因為對同性戀越嚴苛的地方,人們越不敢出櫃,甚至會照樣跟異性結婚來自欺欺人。(當然也可能有些本身是雙性戀,畢竟性取向不是非此即彼,而是一道光譜。只是大部分男女位於光譜的兩端。)
「人們在搜尋「同志色情片」的前後,最常立即進行的搜尋之一是「同性戀測試」(這些測試會告訴男性他們是否為同志)。以「同性戀」搜尋次數來說,不贊成同性戀州反而是贊成同性戀州的兩倍。」
也不奇,在這些地方,人們更易懷疑自己。在可以自由探索性取向的地方,人們可以公開探索、慢慢確認自己的取向,就不用私下懷疑和詢問Google。
#1603 「女性經常搜尋「高挑型男」、「黝黑型男」和「帥哥」,這並不令人意外。但她們有時也會搜尋「矮個子男」、「蒼白男」和「醜男」。有女性搜尋「身障男」、「小屌胖男」和「老醜胖男」。男性經常搜尋「瘦美眉」、「大奶妹」和「金髮妞」。但是他們有時也會搜尋「胖女人」、「小奶妹」和「綠髮妞」。有男人搜尋「光頭妹」、「女侏儒」和「無乳頭女」。這些數據可以讓那些長得不高、不黑、不帥、不瘦、胸部不大也沒有金髮的人感到開心。」
阿燦廖偉雄有教﹕百貨應百客,記住這句話。
「其他引起一些小討論的男性慾望對象是「人妖」(最常見搜尋排名第七十七)和「老奶奶」(最常見搜尋排名第一百一十)。男性在PornHub的搜尋中,約有一.四%的比例是搜尋有陰莖的女性,有○.六%(三十四歲以下的男子為○.四%)的比例搜尋老年人。」
其實看日本那些「六十路」AV就知道了,一般而言這不會是主流。
至於「人妖」和「扶他」(有陰莖的女性)應該要分開兩類吧。
#1620 「在試圖慢慢接受這種事實時,同樣重要的是,記住幻想和現實生活是有差別的。是的,在造訪PornHub的少數女性中,有一小群人搜尋強暴影像但未能如願。大家都知道,這並不表示女性在現實生活中想被強暴,而且這當然不會讓強暴變成比較不可怕的罪行。色情數據告訴我們的是,有時人們會對自己在現實生活中不想發生的事存有幻想,而且他們可能永遠不會跟別人提及這些事。」
其實就正如人們看悲劇和災難片一樣,你不會說災難片很賣座代表公眾歡迎天災的。
只是一談到「性」,很多人原本的邏輯和理性思考就會斷線。
「十五歲到四十四歲的女性中,約有一一%的女性說自己的性生活活躍,目前並未懷孕,而且不避孕。就算相當保守地估計她們有多少次性行為,科學家認為每個月這些女性中有一○%的比例可能懷孕。但這項估計已經超過美國懷孕總人數(每一百一十三位育齡婦女,就有一人懷孕)。在我們對性沉迷的文化中,人們很難承認自己沒有那麼頻繁的性生活。」
男人會這樣不出奇(因為文化中男性習慣以性行為炫耀自己的能力),女人也這樣才誇張(美國文化已經去到連女人也要誇耀自己的性行為了)。在其他文化的女性似乎還不是這樣﹖
#1636 「附帶一提,在Google搜尋中,有關男性生殖器更常見的問題之一是:「我的陰莖有多大?」男性不是拿尺量,而是拿這個問題問Google。我認為這就是數位時代的典型表現。」
我倒覺得他們不是蠢到以為Google會知道他們的陰莖尺寸,他們應該只是想問測量方法(例如是以勃起還是一般狀態為準﹖),但辭不達意吧。
#1636-1647 「男人還希望女人身上有什麼呢?同前所述,眾所周知男人喜歡大奶妹。約有一二%的非一般色情片搜尋是在尋找大胸部,而且搜尋量幾乎是小胸部色情片搜尋量的二十倍。」
#1647 「有關老婆和隆乳的Google搜尋,有一半的搜尋是在詢問如何說服老婆去隆乳,另一半的搜尋則是困惑老婆為何想隆乳。」
最諷刺的是,女權/婦團兩者都反對。喜歡大胸脯的他們說物化女性,喜歡小胸脯的他們又說是戀童癖(我倒覺得這難道不算侮辱小胸脯的女性﹖)。結果所有女性性表現他們都反對。
當然我認為「為了取悅男性而隆胸」是個問題—其他整容亦然,男性應尊重女性的身體自主。無論男女都安心接受自己天生的體格,才是健康的社會。但這健康的社會是要靠教育,而非靠強行壓抑性表現而達致。後者只會加強把「性」視為禁忌的心態。
「他們透露出自己並非只在意外表,也透露出自己十分寬容。事實上,我們都太忙著在意自己的身材,所以根本沒有精力去在意別人的身材。」
真的很喜歡挑剔別人身材者不必多,網上聚集到一堆酸民就足以對所有人(「不只女性」但「尤其女性」)造成壓力。
「在Google的性搜尋中透露出以下這兩個重大關切之間,也可能存在一種關聯:缺乏性愛,以及對個人性吸引力與性能力的不安全感。也許這些都是相關的,也許如果我們對性愛少一點擔心,性生活就會更活躍些。」
但我想性生活不活躍的更大原因是「生活太忙」吧。就算你心裡想做,太多事情做自然就沒時間心力做愛。
#1787 「任何種族主義理論都必須解釋美國存在的一個很大謎題。一方面,美國絕大多數的黑人認為自己飽受偏見所苦,他們有充分證據證實在警察局、應徵工作和陪審團決定時受到歧視。另一方面,很少美國白人會承認自己是種族主義者。」
也沒甚麼奇怪。正如香港以陶傑為代表的歧視者,通常自認為是「崇優」,只是自己厭惡的那些人就不「優」囉。既然(我認為)你不「優」,那麼你就活該被苛待了。
這種心態其實只是暗地裡先自以為「優」,否則就等於認為自己也活該被苛待。就算到自己淪為被歧視的對象,他們也只會認為對方有眼無珠不識其「優」,而不會反省自己歧視別人有問題。
#1801 「數據也說明這跟黑人與白人的工資差距有關,如同經濟學家最近指出的那樣。我發現進行最多種族主義搜尋的地區,就是給黑人工資過低的地區,而且,那就是川普得以成為共和黨候選人參選總統的一種現象。」
歧視甚至可以直接計算。
#1801-1817 「就像天賦一樣,這種性別偏見在現實生活中根本站不住腳,約有二八%的女孩超重,而男孩超重的比例則是三五%。儘管體重計測量出男孩超重的比例多過女孩,但家長對於女兒超重的擔心卻多過對兒子超重的擔心。」
女權人士看到的是「父權社會如何操控女性身體」,但只要跳出女權框框,我們很容易看到事情的另一面是「沒人理肥宅」。(當然以「御宅族」的詞義,肥男不一定是宅,只是在公眾眼光中,肥男就是宅。這其實也是一種女權很少理會的歧視。)
當然女性活在整天要控制體重的眼光下是很痛苦的,但反過來,被社會忽視(家長不擔心正是因為社會不理會男人肥胖)、甚至覺得「無可救藥」,其實也是另一種痛苦。
#1817 「風暴前線是美國最受歡迎的線上仇恨網站。我也了解到,Vikingmaiden88喜歡《紐約時報》的內容。她寫了一篇關於《紐約時報》的激情貼文。」
#1844「仇恨網站的成員反而很愛上自由派大本營的紐約時報網站?怎麼可能?如果許多風暴前線會員從紐約時報網站獲取新聞,這表示我們對白人民族主義者的普遍看法是錯誤的。這也意味著,我們對於網路如何運作的普遍看法是錯誤的。」
他們眼中《紐約時報》應是左膠報無疑,是想找內容來嘲諷吧。
#1832 「風暴前線網站會員抱怨少數族裔使用不同的語言,也抱怨少數族裔犯下罪行,但我發現最有趣的是,跟約會市場中的競爭有關的抱怨。……住在洛杉磯一名四十一歲的學生Whitepride26說:「我不喜歡黑人和拉丁美洲人,有時也不喜歡亞洲人,尤其是當男人發現她們比白人女性更有吸引力時。」」
連「劣等種族」都爭不贏不是更應該先反省自己﹖也不過是自己不濟然後嫉妒別人而已。
「風暴前線網站會員人數增加最多的一天是二○○八年十一月五日,也就是歐巴馬當選總統隔天。然而,在川普以共和黨總統候選人參選期間,風暴前線網站會員人數並沒有增加,在川普當選總統後那段時間,也只有小幅增加。川普善用白人民族主義的優勢,但是並沒有證據顯示他創造一波白人民族主義浪潮。」
很簡單呀﹕既然現實中已做到(推一個白人至上的當總統),又何需上網吵罵﹖
(奧巴馬時就是因為阻止不了黑人當總統,所以不滿者才上網入會嘛。)
#1844 「在美國,政治立場不同的兩個人造訪同一個新聞網站的機率大約是四五%(見下頁表)。換句話說,網路比較接近完全去除歧見,而不是完全隔離。自由派人士和保守派人士一直都在網路上「相遇」。」
#1860 「讓網路不具隔離性的第二個因素是,許多持強烈政治觀點的人會造訪觀點對立的網站,只不過這樣做會讓人生氣和產生爭執。」
但定見已成,重點反而是資訊無法扭轉偏見。
(又隔離問題在社交媒體上可能較嚴重)
#1910 「跟現實生活的社交相比,臉書可能引起更多元化的政治討論。平均來說,人們在臉書上的朋友人數,比在實際生活中的朋友人數還多,而且由臉書促成的這些薄弱關係,更有可能存在於政治觀點對立者之間。」
其實不然。現實生活中的朋友應該更可能政見不同,因為選擇較少,但可能得知政見不同就會迴避討論,因為絕交成本較高。網上朋友較易從同政見的圈子中選擇,與政見對立者絕交的成本很低(因為現實中不認識,反正沒影響)。
#1910-1934 「有些孩子在Google進行一些悲慘又揪心的搜尋,譬如:「我媽媽打我」 或「我爸爸打我」。……在大衰退期間,這樣的搜尋次數就隨著失業率攀升而激增。我認為真正發生的狀況是:虐童案報案數減少了,但虐童這件事本身並沒有減少。畢竟,根據估計只有很小部分的虐童案會呈報給管理當局。而且在經濟衰退期間,許多傾向於呈報虐童案件的人(例如教師和警察)和處理案件者(兒童保護服務人員),更有可能工作過度或失業。……經濟衰退似乎導致更多孩童告訴Google,他們的父母正在毆打他們,也有更多人懷疑自己看到虐童事件。但是,工作過多的主管機構只能處理更少的案件。」
無法保持公共服務穩定,隨著經濟好壞加減人手,其實也會造成問題。
#1934 「是什麼原因驅使女性想要自行墮胎?從進行Google搜尋的地理位置和時間點,找出一個可能的罪魁禍首:在很難進行合法墮胎時,女性就會尋求非法方式墮胎。」
衛道者不會理這個的,他們只要表面好看。
#2038 「當人們一片譁然抗議自己不爽看到朋友在臉書上的生活細節時,私底下卻還上臉書窺探朋友生活的所有細節。」
很多人只是「不想被人看」。(不過很奇怪,不想讓朋友看到何必放上去﹖)
#2108 「但事實是有幫助的,而且不只對祖克柏或者其他想要吸引點擊或顧客的人有幫助,這種知識至少從三方面來說,可以改善我們的生活。首先,知道自己並不孤單,原來大家都有不安全感和難以啟齒的行為,其實挺讓人安慰的。知道大家都對自己的身材沒信心,也讓人開心。」
可惜同樣地,網絡也讓各種仇恨者(種族只是其一)發現「原來自己並不孤單」,在網上找到圍爐,然後覺得他們四出傷害別人很正常。
#2130 「我們往往誇大有多少女性一直認為自己老公「最棒」、「最了不起」和「超可愛」。我們往往低估有多少女性認為自己老公「笨蛋」、「煩死人」和「卑鄙」。」
香港人可能相反﹖畢竟香港男人的別號是「死佬」。
#2185 「我們回到歐巴馬關於伊斯蘭恐懼症的演說。回想一下,每當歐巴馬認為人們應該給予穆斯林更多尊重時,他想要安撫的那群人卻變得更加憤怒。然而Google搜尋顯示,有一句話確實引發當時歐巴馬總統想要的回應類型。他說:「美國穆斯林是我們的朋友和鄰居,是我們的同事、我們的體育英雄,而且他們是願意為了捍衛國家而死的軍人。」在講完這句話後,Google搜尋「穆斯林」一詞後面最常接的關鍵字,在一年多來首次出現改變。這類搜尋後面最常接的字詞不再是「恐怖分子」、「極端主義者」或「難民」,而是「運動員」,再來是「軍人」。事實上,「穆斯林 運動員」還一整天都保持在這項搜尋的第一位。當我們跟原本就很生氣的人說教時,搜尋數據透露出他們的憤怒會因此升高。但是,巧妙地引起人們的好奇心,提供引起人們憤怒者的新資訊並為其塑造新的形象,就可能引導人們的想法往不同和更正面的方向前進。」
所以政客提供適當的引導很重要。
#2422 第五章「我們再次看到,讓男性從小到大死忠支持某支棒球隊的最關鍵年紀,大概就發生在八歲那段時間。整體來說,五到十五歲是讓男孩成為球隊粉絲的關鍵時期。等到男性步入十九歲或二十歲時,要成為球隊死忠粉絲的機率,就是八歲時的八分之一。……那女棒球迷呢?模式不太明顯,但高峰期似乎出現在二十二歲。」
問下足球迷老婆先。
#2434 「依據溫斯頓.邱吉爾(Winston Churchill)這句名言所表達的觀點:「三十歲以前不支持左派的人,就沒有人性;三十歲以後還支持左派的人,就沒有腦子。」吉扎和吉爾曼鑽研六十多年的調查數據,利用超過三十萬的投票偏好觀察資料。他們發現事實跟邱吉爾的說法正好相反,青少年有時傾向左派,有時傾向右派。中年人和老年人也一樣。這些研究人員發現,政治觀點形成的方式其實跟我們的運動團隊偏好形成方式並無不同,都有一個關鍵時期,在人們生活中留下印記。許多美國人在十四歲到二十四歲這個關鍵時期,依據當時總統的受歡迎程度,形成個人政治觀點。受歡迎的共和黨或不受歡迎的民主黨,將影響許多年輕人成為共和黨人。不受歡迎的共和黨或受歡迎的民主黨,將讓這個易受影響的群體加入民主黨的行列。……利用這些數據,吉扎和吉爾曼能夠確定,發展政治觀點的最重要年紀就是:十八歲。」
十八歲正是現在普遍的合資格投票年齡。
方某十八歲時誰是美國總統﹖克林頓。
方某沒因此變成民主黨粉絲(反正你要抓他們的問題也不難,我又不是美國人,沒必要特地支持哪個黨),但的確很厭惡共和黨整天顧著推禁止墮胎和智慧設計論入課室這類事情,腦筋像未開化似的。
而香港人則連續兩代在鮮明的中港對比之下邁向成年(呂大樂口中的第二代尾到第四代頭),港英政府執政遠比中共穩健、不整天「瞎折騰」,就成為「埋下地雷」的「陰謀」了。
#2529 「美國是「機會之地」嗎?答案是,不一定,某些地區是,某些地區不是。……在教育方面花費更多的地區,就讓貧童更有機會出人頭地。教徒人數較多和犯罪率較低的地方,也對貧童更為有利。黑人較多的地方,對貧童較不利。有趣的是,這不僅是對黑人孩童有影響,對居住在那裡的白人孩童也有影響。單親媽媽人口多的地方,狀況也比較差。這種影響不僅適用於單親媽媽的孩童,也適用於居住在許多單身媽媽地區的雙親家庭孩童。其中一些研究結果認為,貧童的同伴很重要。如果他的朋友都很窮,出人頭地的機會就很小,必須更努力才能擺脫貧困。」
這其實不是個別的黑人(或單親),而是社區問題的結果。因為某個社區失敗、或者地價低(或兩者兼之),就會成為貧民區,而美國的貧民多是黑人,所以貧民區通常就是黑人聚居的區。
後者(朋輩窮難出頭)某程度也是港爸港媽出死力要把子女送到「名校」的原因,他們不需要研究就猜到這一點。
「有趣的是,對於最有錢的美國人來說,預期壽命幾乎不受居住地點影響。如果你有很多錢,女性大概活到八十九歲,男性活到八十七歲。……對於窮人來說,情況可不一樣。對於最貧窮的美國人來說,預期壽命依居住地不同而出現極大的差異。事實上,住對地方可以讓窮人的預期壽命延長五年。」
其實很正常,有錢人住到哪裡都是有錢人,自然負擔到更多幫助壽命延長的事物。只有窮人要靠政府提供各種公共衛生要素(高教育、低污染、資助醫療開支),所以住在哪個地區對窮人很重要。
#2552 「真正有關的變數是什麼?就是:有多少富人住在那個城市。一個城市的有錢人更多,表示這個城市窮人更長壽,比方說,紐約市的窮人比底特律的窮人活得更久。為什麼富人的存在,是預測窮人預期壽命的強效指標呢?據推測,有一個假設是由這項研究的作者之一大衛.卡特勒(David Cutler)提出,卡特勒也是我的指導教授之一。他假設具有感染力的行為,可能是促成這種現象的原因之一。有大量研究顯示,習慣具有感染力,所以,生活在富人附近的窮人,可能學習富人的許多習慣。其中一些習慣,譬如:炫耀的詞彙,不可能影響個人健康。其他習慣,譬如:運動,一定會對健康產生正面影響。確實,生活在富人附近的窮人更常運動、菸抽得更少,也不太可能過胖。」
這其實在反駁方某上一段想法,因為他們認為已控制了宗教、環境和醫療保險的差異,所以餘下的唯一因素就是窮人學效富人生活習慣。
(我倒懷疑住在富人區的窮人是否真的生活習慣會健康點,例如你覺得住在港島中西區的窮人就比深水埗的多運動少吸煙﹖是否有這種數據﹖)
方某想法有點不同,我覺得更有可能富人多的城市,能分擔的稅金自然多,於是較能為窮人提供多點服務。假設你想為窮人增加衛生服務(例如資助他們買醫療保險,或者直接提供醫療服務),如果你的城市富人少,想讓他們大幅加稅自然不大可能(他們也會跑掉)﹔如果你的城市富人多,每人多付少許你就可以收集到大量資金了,可行性自然高一點。而富人多的城市同時有很多富人喜愛的服務(例如紐約的博物館和歌劇院之類),他們可能願意交多少許稅換取生活便利。
他們可能要控制到不同城市的稅率才說服到在下。
#2589 「大學城最成功產出頂尖人物的領域之一就是音樂……這種情況當然不只發生在藝術領域,大學城也培養出人數超出預期的知名商人。也許早期接觸尖端藝術和想法,也對日後成為紅頂商人有幫助。」
不知原文是甚麼,但「紅頂商人」有特殊含義(指同時橫跨官商兩界的商人,因為清朝捐官到二品有資格戴紅色頂戴而得名),未必適用於外國的富商(除非是介入政界甚深的那些)。
#2599 「哪些變數不會影響孩童是否出人頭地?我發現一個讓我有點驚訝的變數是,該州花費多少資金投入教育。在城市地區移民人口比例差不多的州,教育支出與該州培養知名作家、藝術家或商業領袖的比例並無相關。比較我的維基百科研究跟先前討論過切提團隊的一項研究,就會發現真的很有意思。回想一下,切提的團隊試圖找出哪些地區最能讓人們晉升中上階級,我的研究則是設法找出哪些地方擅長讓人們成名。兩項研究的結果有顯著的不同。花大錢投入教育,確實能幫助下一代晉升中產階級,但是對於讓下一代成為知名作家、藝術家或商業領袖則沒有什麼幫助。這些有大成就的名人有很多都憎恨學校,有些還被退學。……如果你想確保兒女晉升中上階級,紐約市就不是一個教養小孩的好地方。但我的研究發現,如果你希望小孩有機會成名,那麼紐約市可是教養小孩的絕佳地點。」
一將功成萬骨枯,但以政治角度而言,我們還是需要提升大部分人,而不能只靠少數成名者。(「市場原教旨」很容易傾向後者,覺得既然不投資教育也能有人成才,自可節省稅金。大部分人階級無法流轉的後果,他們不理。)
#2618 「在世界某些角落的人們相信孕婦飲用冷水可能會導致胎兒肺炎,但我不知道有什麼醫學證據證實此事。」
重點是凍品容易不衛生啦。你在衛生良好的地區喝冷水吃冰凍食物,可能沒甚麼大不了。可是在衛生較差的地區,冷水和未煮熟的食物很容易被細菌感染。孕婦容易流產,當然要更小心一點。
#2725 「男人似乎被自己剛剛在螢幕上看到的東西給催眠了。」
正如男人飲醉後打人一樣,只是借醉行兇啦。
#2837「還有一些心理學實驗的證據證實,實驗對象表示即使沒有模仿暴力電影的場景,但是看這類電影就會讓他們更憤怒也更充滿敵意。」
最大問題是實驗室和現實並不一樣,人們的反應亦未必一樣。
「這兩位經濟學家發現,在超夯暴力電影上映的週末,犯罪率下降了。你沒有看錯。在超夯暴力電影上映的週末,有幾百萬美國人在電影中看到殺人景象時,現實生活中的犯罪率卻明顯下降。」
正如色情電影一樣,很明顯絕大部分正常人看電影就發洩了,不需要在現實中做出來。
#2854 「凌晨十二點三十六分是搜尋「自殺」的高峰,而在上午九點左右是這類搜尋頻率最低的時段,數據顯示大多數人在早上時不像我這麼悲慘。」
我想應該只是早上忙到沒空去想或者搜尋自殺問題啦,人通常是靜下來才會想這類東西。
「在凌晨二點到四點之間是人們提出這些重大問題的黃金時段:意識是什麼意思?自由意志存在嗎?其他星球上有生命嗎?這些問題在深夜如此普及,有部分原因可能出在吸食大麻。在凌晨一點到二點,「如何捲大麻菸」的搜尋率達到高峰。」
應該都是因為「太閒」,睡不著的人有很多時間胡思亂想。
(正如李天命曾言,很多人問哲學問題是因為沒拖拍,有拖拍的通常沒空想這些。)
「他們發現跟其他週末相比,放映超夯暴力電影的那些週末,犯罪率從週末當晚稍早就開始下降。換句話說,在影迷剛走進電影院,甚至還沒開始欣賞電影前,犯罪率就開始下降。……暴力電影《人魔》上映,耍狠好鬥的年輕男性會進電影看這部片。但是要他們挑選《落跑新娘》這種片去看,他們通常不會想看,所以就會上酒吧、俱樂部或去打撞球,而這些地方就是暴力犯罪發生率較高之處。原來,暴力電影讓有潛在暴力者離開街道。」
潛在暴力犯去了戲院看戲,所以沒空犯案。
#2939 註160「念過史丹佛大學的美式足球隊前外接球手艾德.麥卡弗里(Ed McCaffrey)就用這個觀點證明,讓四個兒子都踢足球是有道理的:「這些傢伙都精力旺盛,所以如果他們沒有踢足球,就會玩滑板、爬樹、在後院捉迷藏、玩彩彈射擊遊戲。我的意思是說,他們不會乖乖坐在那裡,什麼事都不做。所以,我的看法是,至少玩足球是有規則的。」
看來我也要讓方包上足球班。
#3252 第六章「我預測你答對半數以上的標題,也許你是考慮自己會點擊什麼才答對的,但是你可能沒有猜對所有標題。」
結果傳媒幾乎都變成標題黨。
#3270 「《不可抗拒》中引述崔斯坦.哈里斯(Tristan Harris)這位「設計倫理學家」的論點,解釋人們為何如此難以抗拒網路上的某些網站:「螢幕另一頭有一千人,他們的工作就是打破你的自律。」而且這些人正在使用A/B測試。」
令人上癮的事其實是否應該要規管一下﹖
#3365 「因為透過廣告所賺取的收益大到驚人。我們樣本中的電影商平均支付約三百萬美元,買下超級盃一個廣告時段,讓票房增加八百三十萬美元,投資報酬率為二.八比一。」
難得有實驗可以量化證明。
#3379 「瓊斯和奧肯發現,成功的暗殺戲劇性地改變世界史,把國家帶往截然不同的方向。新領導人讓以前講究和平的國家訴諸戰爭,或讓以前爭戰不休的國家落實和平;新領導人讓經濟繁榮的國家開始步入不景氣,或讓經濟不景氣的國家開始蓬勃發展。事實上,這種暗殺是自然實驗的結果,推翻了幾十年來人們對於國家如何運作的普遍看法。許多經濟學家以往傾向於認為國家領導人是由外力掌控的無能傀儡,但根據瓊斯和奧肯對自然實驗的分析,事實並非如此。」
但會否是自然鐘擺,沒死人也隨時會發生﹖
#3399 「為了測試發橫財的因果關係,經濟學家將買彩券中獎和買彩券沒中獎的人進行比較。這些研究往往發現,中獎並不會讓你在短期內變得快樂,但長遠來說卻會讓人變得快樂。」
「中獎不會讓你短期內變得快樂」反而有點令人難以置信。
(當然長期是否快樂其實取決於你如何用那筆錢。)
「數據顯示,鄰居中了彩券可能會對你的生活產生影響,比方說,如果你的鄰居中了彩券,你更有可能買一輛昂貴汽車,如寶馬(BMW)。為什麼?經濟學家認為幾乎可以肯定的是,原因出在發橫財鄰居買了昂貴汽車後,讓你心生嫉妒。……不幸的是,詹森先生往往買不起寶馬汽車,這就是經濟學家發現彩券中獎者的鄰居更可能破產的原因。」
這不是蠢嗎﹖中獎的又不是自己,買東西前不用自己衡量一下﹖
#3543 註195「這些結果並不表示醫生很邪惡。事實上,如果當他們領到更多錢,而多多進行的手術真的能救人性命,反倒會讓我們更加擔心。如果情況真是如此,那就表示醫生進行救命治療,必須拿到應得的費用。克萊門斯和戈特列布的研究結果顯示,不管醫生能拿到多少手術費用,只要能救人性命,他們都會做。對於沒太大幫助的手術,醫生則會在取得合理手術費用的情況下才會進行。換句話說,醫生不太關心攸關性命治療的金錢誘因,但卻相當關心不重要手術的金錢誘因。」
這說明了高薪養士的必要。
香港公立醫院的醫生往往如此,要是你有危及生命的大病,他們會盡心醫治﹔要是你的病不太嚴重,他們就沒空理你了。
#3446 「這種使用明確數值作為區分標準的自然實驗非常強大,連經濟學家都幫它取了名字:迴歸的不連續性(regression discontinuity)。每當有一個確切的數字將人們劃分成兩個不同的群體,就會出現一種不連續性,經濟學家可以針對極為接近這個區分標準的人們,比較或迴歸其結果。」
學到了。
#3458 「經濟學家發現被分配到更嚴格環境的囚犯,出獄後就更有可能再犯罪。監獄環境愈嚴苛,反而沒有阻止他們犯罪,而是讓他們變得更冷酷無情,一旦回到外面世界後就更加暴力。」
可見那些聲稱「罪犯奢言人權」的輿論,除了冷血,也是無知。
「學校能收的學生名額有限,入學考試競爭激烈,但念明星學校卻沒有讓大多數學生的學習獲得改善,實在沒有道理。」
你想有甚麼道理﹖明星學校之所以受歡迎,本來就不一定在於「讓大多數學生的學習得以改善」。有些人可能是想有更好的人脈/社會資本(如#2529所示),有些人則見到明星學校學生成績好,以為進去後就會好,而忘記了那些學生本來成績就好。
#3471 「人們會依據自己的經驗做調適,會成功的人在任何情況下都能找到優勢。讓你成功的因素是你的才能和你的動機,而不是找名人當畢業典禮演講嘉賓或提供你其他優勢的頂尖名校。」
那麼#2529提到的人脈/社會資本呢﹖
#3486 「放大檢視通常需要大量且全面的數據集,隨著世界日漸數位化,這種數據集愈來愈多。由於我們不知道大自然選擇何時進行它的實驗,我們無法設計一個小調查來衡量結果,所以我們需要大量現有數據,才能從中得知這些干預,因此,我們需要大數據。」
大數據的重要。
#3613 註204「這群二十多歲到五十多歲的人,竟然還有那麼多人記得自己十幾歲的考試經歷,著實嚇壞了我」
因為升學畢竟是人生重要一站,連方某都寫到幾篇,何況。
#3674 第七章「我們注意到當特定領域的現有研究薄弱時,新數據最有可能發揮重大價值。關於這世界的一個不幸真相是,你可以更省時省力獲得關於種族主義、虐童或墮胎的新見解,但要獲得企業營運績效如何讓你有利可圖的新見解,可就沒那麼容易。這是因為已經有大量資源投入衡量企業營運績效」
必須記住這一點。
#3717 「問題在於:我們可以衡量之物通常未必是我們關心之事。我們可以衡量學生在複選題測驗的成績,卻無法輕易衡量批判性思維、好奇心或個人發展。」
又是(傳聞)愛因斯坦的那句﹕Not everything that can be counted counts, and not everything that counts can be counted. (並非所有能計算的事物都有價值,亦非所有有價值的事物都能計算。)
#3735 「一些老師也開始留意大數據的盲點。美國也更加努力用小數據作為大規模考試的補充,學生調查激增,家長調查和教師觀察(讓其他有經驗的老師在課堂上觀察在上課的老師)也激增。」
香港亦然,但調查太多也可能失效。方某見得太多面對一大堆問卷於是決定亂填的學生了。
#3788-3869 第八章「你可能會認為,或者至少你希望,有禮貌、公開自己信仰的人最有可能還清貸款。但事實並非如此。數據顯示,平均來說,這種人比較不可能還清債務。……提到上帝者,更可能拖欠還款的比例是二.二倍。這是預測有人可能不還錢的最強效指標之一。」
其實是因為現實中沒其他東西支持自己,就唯有扯去談上帝了。
「最有可能不還清貸款的貸款申請者使用的措詞﹕「上帝、會還錢、醫院、承諾、感謝」
借了不還當然要講多謝。
#3869 「在不久的將來,想申請貸款的消費者不僅要擔心自己以往的財務狀況,還要擔心自己在網路上的活動。放款業者可能以看似荒謬的因素審核申請者的貸款申請案,譬如:申請者是否使用「感謝」一詞或祈求「上帝」。那麼,最近姐姐住院真的需要錢救急,最後肯定會償還貸款的女性該怎麼辦呢?因為事實證明,聲稱需要錢支付醫療費用的人往往在說謊,結果就讓真正需要錢救急但會還錢的人借不到錢,這種懲罰未免也太沒道理。……這裡所說的道德問題就是:企業是否有權利根據與該項服務沒有直接關係的這些抽象統計預測標準,判斷我們是否符合資格使用他們的服務?」
又或者,借給你但罰加息以彌補爛賬風險,於是令有真正需要的人更可能還不起錢,惡性循環。
#3887 「這不是什麼新問題。長久以來,人們在求職時一直受到與工作表現無直接關係的因素所判斷,譬如:握手是否肯定有力、穿著是否整潔乾淨。但數據革命的一種危險在於,隨著生活各個層面日漸被量化,這些代理判斷可能會更深奧也更擾人。更準確的預測可能導致更微妙和更惡毒的歧視。」
例如方某這種不擅交往的宅男本來就被看低一線,話說回頭這些演算法算不算宅男大報復﹖(抑或是一批不那麼宅的去坑更宅的﹖)
#3897 「像Yelp這種公布餐廳和其他服務評價的網站,就是一個重要武器。哈佛大學經濟學家麥可.盧卡(Michael Luca)最近的一項研究顯示,企業有多麼任由Yelp的評論擺布。將華盛頓州的這些評論跟銷售數據進行比較,盧卡發現在Yelp網站上的評價少一顆星,將使餐廳收入下降五%到九%。」
結果香港的同類網站只是多了一堆做媒的打手,人們對評價自動打折扣。
#3978 結論「因此,社會科學革命是不可能以相對論E = MC^2這種簡潔公式出現的。事實上,如果有人依據一個簡潔公式宣稱社會科學革命,那你應該抱持懷疑的態度。」
歷史已經說明。
#3995 「如果你把數學轉化為一個遊戲,學生會覺得更有趣也了解更多,測驗成績也會更好,對吧?錯了。透過遊戲學習分數的學生,比以更標準方式學習分數的學生,在測驗時的表現更差。」
這倒不出奇,只不過側證了教師群一向的懷疑。
要學好,總不免有刻苦沉悶。你只能培養內在動機令學生刻苦而不沉悶,但舒服不會學到任何東西。(就算打機過關也要苦練呀)
又或者學生只當成玩,根本沒打算記住裡面的東西。當然另一個可能是﹕考試測驗是要練習的,而標準方式比較接近考試測驗的模式,所以遊戲學習未必學不會,只是考試測驗會吃虧(於是老師們也不願意全面採用)。
#4018 「這本書大約只有七萬五千字」
似乎只包括內文而不包括註釋。
畢竟本書標示字數是145,233,英文原著字數不大可能比中文更少。
#4058 謝詞「崔賢榮(Hyunyoung Choi,音譯)」
名字看來應是韓國人,韓文的崔的確是Choi,而Hyunyoung的確找到另一位叫賢榮的女星。當然會否是同音字就很難說了,所以除非找到原名,否則只能註明「音譯」。
#4068 「諾亞.史蒂芬斯|大衛德維茲」
這裡顯然應該是頓號(、)但不知為何誤植直線。