analysis

顯示包含「archives」標籤的文章。顯示所有文章
顯示包含「archives」標籤的文章。顯示所有文章

星期六, 3月 08, 2025

索引史


Dennis Duncan《索引,知識的鑰匙》(Index, A History of the: A Bookish Adventure),台北﹕商周,2023

顧名思義,就是講「索引」的歷史囉。索引即是學術類書籍末尾出現一堆跟字母排列(中文有時按筆劃),告知相關內容在書中哪幾頁的列表。似乎只有圖書館員或者學者才有興趣﹖(笑)

正如本書推介本身所示,索引看似學究和遙遠,實質與所有人密切相關。尤其現今網絡世界,早有yahoo後有google,實質都是一種(網頁的)索引。

在未有索引的時代,書裡所有的內容都要背下來。所以古人所謂「學富五車」者,往往同時也是「過目不忘」。要不然想從一堆竹簡或者莎草紙卷中找回原文,實在費時失事。所以不止是識字讀書的機會少,要掌握好學問的難度就更高。

(後話﹕其實在竹簡時代,一部書要用很多竹簡,甚至分很多卷才完成。堆滿五架牛車可能也不及今日用五架購物車裝的書內容多。當然那個年代的書也沒多少就是了,所以能有五架牛車的書當然很厲害。)

而作者說得清楚,竹簡或莎草紙卷這類「卷」形書要發展出索引還是很難的﹕

#85 「由此不難想見為何索引屬於翻頁書時代而不適合卷軸書時代:技術本身具有隨機存取(random-access)的性質,只有能夠快速輕巧在前中後任何位置進行切換的書本結構才與其相容。翻頁書是歷史上第一個能讓索引發揮功用的資訊媒介。」

書卷的情況就跟使用磁帶儲存的設備,很難做到隨機存取,想找到特定位置也不容易。

但無論書籍形式,顯然不可能所有人都這樣把所有東西都背下來,尤其是帝王將相之類的大忙人。於是索引首先以「目錄」形式出現,先讓目標讀者知道內容結果,無需讀完整套書(往往分成多「卷」)才看到自己特別想讀的內容。而目錄或索引出現後,自然也方便到需要在大量文本中搜索文句的教士和學者。

正如書籍出現後,智者就開始擔心人們依賴書本而非自己的記憶和心智,會造成智力退步。索引出現後,同樣有人認為索引令學生不用讀完整本書,會造成零碎片面的理解。有沒有發現這種擔憂,跟我們現在看網絡對人的影響很相似﹖(多少學生只在google隨便打個問題,然後就把頭幾個結果抄下來交功課﹖)
(當然更甚者,我們更擔心短片視頻滿足短暫注意力的需要,令人們進一步沒耐性仔細思考。)

有趣的是,索引似乎是種「純屬西方」的發明。中國有類書,類似百科全書,某程度上也跟索引相似,把古代不同書籍的內容編纂一起分類排列,方便讀者查看。但中文古書似乎有類書、有目錄,而無索引。
原因可能是作者所言﹕索引首先要定個順序。西文書籍可以靠字母排序,漢字卻如《中文打字機》所云,沒有簡單的排列順序。《永樂大典》據聞按韻排列,字典多以部首和筆劃(還可以靠拼音和四角號碼)。可是同一韻同讀音的字、同一部首同筆劃的字該誰先誰後,卻沒有像字母排序那麼簡單的方法。當你那套書像永樂大典那麼宏偉,連目錄都有57冊,要弄索引只會更長。如果索引沒有簡單的排序方式,讀者根本連條目都找不到,遑論內容。

更好笑的是,不看本書不知道,索引原來不只學習才用得著。小說可以用索引方式製造疑團(索引本來就要斷裂內文,小說家正好利用這點設計一個「破碎」的故事)。索引條目既然不是把內文胡亂漫索,而要人工選取跟內容主旨相關的「合適」條目,即是有主觀成份,學者和政客竟然可以利用索引條目詆毀對手。

到最後,近世的知識和出版爆炸,迫使學人嘗試製作橫跨不同作品和領域的「泛用索引」,以《期刊索引》作結。最後編製索引工作由人手進入機械化,又開出今日的網絡搜索引擎。

一本小書,不見得能讓你完全了解索引的歷史,但簡單回顧一下索引的往事,仍是令人回味之旅。

(方某人其他書評書介)

(如果閣下有興趣讀電子書,經本文連結 https://moo.im/a/6adjwyhttps://moo.im/a/6hqDEY 購買,本人將獲得平台回饋。當然看倌不一定要經這條連結買的。)

---

筆記,或挑骨頭﹕ 

#15 推薦序「編輯,除了編排文字的段落、篇章、校對文稿、下標題、製作目錄,有時還要費神編纂註釋,或在書末加上索引。這些經常被讀者忽略的細節,卻往往是作者做不來,編輯若不做就沒人做的苦差事。編輯能為一本書加分到超乎作者想像的程度,也難怪很多作者要心生感激,對編輯大聲道謝。」

以為註釋是作者或譯者做的呢。

#30 「索引也曾被有心人拿來做為惡搞對手的工具,特別是在著作權意識還不彰顯的時代。」

有如地圖故意植入錯誤一樣。

#50-76 前言「「索引」究竟是什麼?一般而言,它是一套標記目標位置以節省時間的系統。索引的英文(index)呈現出類似地圖的空間關係:「指示」(indicate)出想找的東西位於何處。……中世紀末期,register、table、rubric這幾個單詞同時能表示目錄與索引,導致一般人更難區隔兩者。」

倒沒想過這層關係。

#103 「主要探討字母排序的方式如何拆解書籍、條目,甚至特定字詞。索引技術作為書籍的附屬品,出發點是提升特定模式的閱讀速度,學者通常稱其為摘錄式閱讀(extract reading)」

其實百科全書本身就可以當成一套大索引。

#147 「一五四三年三月,亨利八世治下的教會派人搜索約翰.馬貝克(John Marbeck)的住家。……他被關進王室內務法庭監獄,正常來說小命難保。」

看不明是甚麼,星室法庭﹖網上說Court of the Marshalsea的中譯,而事主似乎的確是在這受審和囚禁。

#354 第一章「首先教養良好的你得學會字母順序,要真的學通,才能在「不查書的前提下」記得順序。考德瑞對大眾「不諳語文」的想像實在驚人!現代人覺得理所當然,他卻得長篇大論加以說明:字母和字典之間存在對應的空間關係,詞彙首字母比較前面就會收錄在比較前面的位置。」

面對中文授課中學(CMI)學生多了你就會明白這並非本能,字母順序是學背的。

「這些案例再再說明字母排序原本並非直覺反應」

應為「在在說明」。

#487 「古跡上刻有祭祀阿波羅與海克力斯的信徒名字,還特別標註名單應該「從alpha開始照字母順序排列」」

古代版「排名不分先後」。

「現代人或許以為羅馬帝國幅員遼闊、階級縝密,字母排序必不可少,但事實並非如此。」

可能正因為階段嚴明所以排名「必」分先後,已以顯貴和重要性分先後,自然不需要再用其他方式。

#827 第二章「想不到有人能在經文間轉換得如此流暢靈巧。幾年後他回憶起那天演說,形容說「來回往復卻不離其道」,其妙舌慧心「以經典權威的滋養使口中開出花朵」」

有如中文之「舌燦蓮花」。

#865「實際上「格羅斯泰斯特」是姓氏,抑或是他展現才能後得到的尊稱,我們都無法肯定──原文Grosseteste可以拆解為Grosse tête,字面意義即「大頭」。」

古時庶民大概沒姓氏吧。

#1183 第三章「這個傳統保留至今,現代人的日常生活依舊以章節來記測閱讀進度。反觀現代索引幾乎棄章節於不顧,稍微瞭解篇章概念就會明白個中緣由。」

篇章沒有固定長短,其實無法方便搜索內容呀。(古代每一章的長短可能受制於材料和製作方法而不會差太遠﹖)

#1229 「為了使用者方便以及不同格式轉換時的連續性,電子書也可以加上頁碼,如此一來無論讀者怎麼更動顯示設定都能與實體版對照。不過沒人規定出版社得這樣做」

方某自從看電子書後就提倡這樣做比較好(留意我沒說要誰「規定」這樣做)。一來書末索引較易使用(索引都是寫頁碼,一個詞語通常對應多於一頁,無法單靠連結和錨定一對一處理),二來方便電子書讀者與實體書讀者交流。(正如在下寫書介有記錄#的數字,實體書讀者還是不知道在哪一頁的)

#1245 「以Kindle為例,每一百五十位元組(bytes)會下一個名為「loc#」的定位碼,好比切割內容後貼上數字標籤。「loc#」和頁碼一樣獨立於內容而強行插入,不考慮思緒是否連貫、語氣停頓是否合理,無論權威人士談話或者斜體縮排超連結的控制代碼,只要湊滿一百五十個位元組就必定被切斷,是相當無情的演算法。好處在於很精細,目標詞語的可能範圍小於一則推特貼文長度。」

這似乎只是出版社的規矩﹖Kindle可能強制規定了,可是讀墨買到的書似乎沒有。有些書註釋的連結不一定落在原位附近(不論是內文的註釋號連到註釋文,還是由註釋文回到內文註釋號皆然),在電子閱讀器上有時要向前或後揭一兩次才去到所需地方。

「《芝加哥格式手冊》(The Chicago Manual of Style)似乎對它就不大滿意,指出即使引用電子書,篇章或段落編號這類基於文本、不具任意性、沒有自創格式的分割標準依舊比較好,轉換便利優先於切割精細。手冊建議大家若真的不得不引用電子定位碼,至少要記得附上總數,例如「位置碼3023之444」,如此一來其他格式的讀者至少能大概推算索引條目落在什麼部分。」

看來可以方便實體書讀者的方法。
可是方某寫的電子書書介全部都沒包括總數這一點,畢竟寫書介的時候只顧抄下位置碼,根本沒留意原書(最後一頁)的位置碼編到哪裡。

「收藏在慕尼黑的巴伐利亞國立圖書館(Bayerische Staatsbibliothek)。」

成立當時的確是「國立」(巴伐利亞曾是獨立國家,港稱拜仁),現在似乎稱「州立」更貼切。

#1280 「薛佛代表了印刷時代初期的社會心態,並非想與過去切割乾淨。恰好相反,他們希望印製出來的書本與手抄本盡可能相似,若讀者無法分辨就再好不過。若要給頭十年的印刷業下個座右銘,大概會是「物美價廉」。挑選字體時盡量貼近筆跡,還在篇章開頭放上花俏大紅字以模仿手工雕琢感。薛佛書單的招牌是聖經,居然採用羊皮紙印刷。」

聖經用羊皮紙印刷以示尊貴,才不出奇吧﹖

#1669 第四章「索引還是在前面的,只不過分量和音量都不該喧賓奪主。21[127]」

21在這裡出現不知何解,因為前面的註釋已經編到122號,21顯然不是註釋號。而[127]看來是頁碼,抄筆記抄到這裡才發現原來本書的電子版終於加了頁碼。

#1786 第五章「一九九○年代末,有個網站嘗試將自然語言引入程式碼,避免使用者得跳脫日常生活的句法規則,而可以直接輸入例如:「請問外蒙的首都在哪裡?」這個網站叫做AskJeeves」

英國人應該不會用「外蒙」這個名吧﹖就算在台灣現在應該也不流行﹖

#1865 「接著指控對方只靠索引與字典做研究,「在我看來賓特利博士應該更深入鑽研文獻內容並諮詢原作者意見」」

這個評語其實是離奇的,因為學術討論從來不需要這樣。如果原作者死了難道要問米﹖

#1924 「雷伊先生對假具的定義。」

原來是指面具。

#2087 「他刻意淡化為何不經審判即處決犯人,答案是那些人本就被褫奪公權,失去法律賦予的身分和權利。」」

褫奪公權等於褫奪人權﹖褫奪公權只是剝奪政治權利呀。(但大陸對政治權利的解釋比台灣寬得多)

#2368 第六章「「卡塞爾國家圖書館系列」(Cassell’s National Library)」

這是常見的錯譯,但Library在這裡是指一大批文章的集合,而不是實體的一間圖書館。如果不要用中文「叢書」,這種Library實以日文「文庫本」的「文庫」稱之更妥。

#2386 「索引表格未必有何妙用,卻能營造尊爵不凡、豐盛華美的印象」

以為是「尊貴不凡」之誤。雖然在網上查到也有人用「尊爵不凡」,但這個詞是誰發明的﹖

#2410 「整個表格看上去像趕工出來而亂七八糟,根本派不上用場」

假手於人的結果。所以編索引確是一種苦差。

#2412 。一七一九年丹尼爾.笛福(Daniel Defoe)的《魯賓遜漂流記》(Robinson Crusoe)和一七二六年綏夫特的《格列佛遊記》(Gulliver’s Travels)都很成功。」

原來後者是長篇。

#2457 「譬如後面那條講的並不是任何「婚姻」,也不是夫妻一同到老,而是長者與年輕配偶成婚這樣清楚的前提。理查森透過小說提供讀者特殊情境下之道德困境的指引,索引則提高了讀者查詢的效率。」

誰要靠小說指引人生﹖

#2478 「可是友人並不買帳,根本沒打算閱讀索引《全集》,可見許多人並不希望小說成為佈道媒介。」

不完全是(也有人寫小說佈道,有些宗教出版社也出版小說),但至少讀者不會當成《聖經》這類宗教經典般去翻查吧。

#2498 「雖然後來學界針對字詞或主題習慣從牛津字典裡尋找最早的示例,詹森博士為每個釋義找出例句的做法非常成功,詞典成為透過索引學習的絕佳工具,羅賓.瓦倫扎(Robin Valenza)稱之為「索引學習的神化(apotheosis)」」

有多神化﹖

#2686 第七章「記者對美國代表團帶去展示的旋轉書櫃特別著迷,認為是「學生想給圖書館重新布置時的好選擇」。(但這話只說對一半:現在各大書店都有旋轉書櫃沒錯,學生單位反倒不常見。)」

「活動書櫃」﹖會旋轉的書櫃其實很費空間,書店也不一定有呀。(旋轉的雜誌架倒比較多)
但與旋轉書櫃相比,書店更少見到活動書櫃。

#2697 「各圖書館製作的目錄有太多重複內容,若能精簡這些過程,或許反倒省了所有人的時間。」

結果就是行內所謂「抄錄編目」(copy cataloging,簡稱copy cat)。

#2767 「泛用索引就像顆巨大的腦袋需要空間存放和整理資料,但學會並沒有與之相符的場地可用。六年後他們有了據點卻已經太遲,學會開始走下坡,儘管核心成員挹注很多心力仍未能點燃大眾的熱情。」

正如一個伺服器。

#2825 「普爾製作的索引每次標題頁都有同一句話,是他在耶魯求學時得自拉丁語教授的格言:Qui scit ubi sit scientia habenti est proximus──「知知識之所在,離知識不遠矣。」

確焉。

#3102 第八章「這次他們將虛詞(function words,亦稱功能詞)放進詞庫,有and、but、the、with、this等五百多個。孛可的程式「閱讀」文件以後篩掉這些詞語,經過清掃還能倖存的就有資格進入索引。」

在搜尋引擎的術語稱為「stop words」,因為太常見又沒特定意義,所以搜尋引擎會直接跳過它們。

#3142 「嵌入式索引建立在數位標記的功能上,技術本質無異於網際網路的根基」

其實就是HTML的「超文本」標記語言所示的。

「現代人習慣電子裝置以後,不只對搜尋更講究,還對分類產生莫大熱情,話題標記(hashtag)就是個好例子。」

Hashtag只是個索引標籤不是分類吧,某件物事的hashtag可以有很多個,分類只能有一個。

#3264 「南希.貝利(Nancy Bailey)成立第一所限女性的索引公司」

這不算是性別歧視麼﹖抑或歧視男性就沒所謂﹖

#3437 附錄一「精準 accuracy, 100, 178 自以為 supposed, 15

後者應該是次標題(即是自以為精準 supposed accuracy)而非同級標題,開新行後應右縮。

#5382 附錄二「《岸濱雜誌》 Strand Magazine」

刊名有時會音譯。

#5655 「此字母無詞條 X, no entries beginning with

有必要這樣寫嗎﹖不是直接跳過字母就好﹖

星期六, 6月 08, 2024

大數據:隱私篇


Viktor Mayer-Schönberger《大數據:隱私篇》(delete : The Virtue of Forgetting in the Digital Age),林俊宏譯,台北﹕天下文化,2015

工作太忙(咦這次科技商管閱讀馬拉松比賽頁面好像叫我把工作扔給AI就好),看來應該來不及在限期前為看完的書寫篇完整的介紹了。這裡先寫一本剛讀完的。
本書篇幅不多,論點也簡單。書中重點並不是現在一般講「侵犯私隱」的那些,有人駭進伺服器把資料偷走、科技巨企未經用戶同意就用數據行銷、或者政府暗中監控人民之類。這些雖然都是私隱問題,可是在民主社會至少還可以靠法律處理。(雖然作者也指出,巨企與一般客戶實力懸殊,客戶很難靠法律行動追究它們。只有客戶重視私隱,商業壓力才能迫使它們尊重私隱。)
作者認為影響更重大深遠的私隱問題,是數碼時代帶來的永恆記憶,令進入公眾領域的「個人資料」永遠無法消失。現在任何人做的蠢事壞事,只要有人(無論自己或別人)放上網,事後刪掉也沒用,因為網民(台灣稱鄉民)自會幫你「刪一貼十」。《香港網絡大典》就保留了很多這類東西。
永遠記得有蠢事壞事發生過,聽起來不是壞事,但是作者認為很有問題。作者舉例說明,有不少人「因為年輕犯下的錯」,以致幾十年後生活被毀。那些錯事如果在類比時代的「古時」,因為不是甚麼大案要案,早就被世人遺忘。作者認為人類就是會遺忘,所以犯錯的人才有重生機會。(有些地方法律規定輕罪罪犯長期沒犯法的話,犯罪紀錄就不能再被檢索和引用,正是此意。這是一種制度化的遺忘。)
可是,當我們進入數碼時代,彷彿所有事情都可以永久紀錄下來,於是一些小錯就可能在日後被重挖出來。但人類的認知系統又會把這些「重挖」的事當成新事看待,於是令我們不能寬恕當事人,間接令犯錯的人無法更生。(當然的確有些人是會死性不改,這裡問題是連肯改的人都無法擺脫過去。)
更大的問題是,如果我們知道自己一言一行都會被永久紀錄,那就真的實現了曾子那句「十目所視,十指所指,其嚴乎﹗」。這本來只是君子修身的自我要求,卻變成無論賢愚所有人的現實。帶來的全民自我審查,反而可能窒礙了民主社會。
作者討論了六種現有的對策,認為它們都各有優劣。各自有部分功效,但就算一起運用也未必能解決作者最關注的遺忘權。(像歐盟實施被遺忘權那種較激進的做法,也很難於其他地方推行。)
作者建議比較容易實行的方案,是為(至少大部分)數碼資料加上「到期日」,令數碼資料也有「被遺忘」的一天。這一點只需在檔案添加後設資料(meta-data)就行,立法施行的難度也低得多。
這個建議最大的問題,是一到指定日期就刪除的「斷崖式」遺忘,其實也頗驚人的。作者本身建議為數碼資料逐漸加上雜訊,模仿人類記憶衰退過程,又似乎太複雜。
我想比較簡單的方法,其實可以仿傚現有的紙本檔案管理方法,訂立「到期日」並不是「一到即刪」,而是一個「檢視日」。即是到期電腦會詢問擁有者是否要保留(選擇要就再選定下一個覆檢日期),讓人有「刀下留檔」的機會。如果過期一段日子都沒有選擇保留,才由系統代為刪除,或者像作者所言,逐漸添加雜訊。

(方某人其他書評書介)

(如果閣下有興趣讀電子書,經本文連結 https://moo.im/a/8lBGNQ 購買,本人將獲得平台回饋。當然看倌不一定要經這條連結買的。)

---

筆記,或挑骨頭﹕

#4-9 誌謝「同樣要感謝的是,近兩年來世界各地與我交談討論的傳統媒體記者及新媒體記者,他們的提問令我更清楚如何修正及發展論點。」

好記者的功效。

#15 第1章 無法從記憶抹去的「醉海盜」「原本只是朋友間的玩笑罷了,但是在史黛西實習的學校裡,有個熱心過頭的老師,覺得這張網路相片可能讓學生看到竟有老師喝酒,有違教師專業,所以一狀告上大學。」

其實最大的問題是大學竟然接受投訴吧﹖﹗有哪條教師專業守則說教師下班後不能喝酒﹖如果喝酒也不能的話,大概在照片自稱「海盜」也能說成是鼓勵學生犯法﹖(當海盜還不犯法﹖)

#112 註1「史黛西將自己的大學告上聯邦法院,原本已經快要結案,但最後還是轉到東賓州聯邦地方法院審理。到了2008年12月,法院認定她發布在MySpace的照片及注解文字不受憲法第一修正案保護,判她敗訴。」

照片和註釋為何不受憲法第一修正案保護﹖
如果細看判辭,原告似乎是輸在技術問題,多於法官認為照片和註釋不受保護。被告(大學)聲稱第一修正案不適用於師訓生,認為後者有如公務員的言論自由受紀律約束,法官認為這一點看歷來判例無法認定。可是法官接納被告聲稱﹕就算被告真的侵犯了原告的言論自由,由於法律在這一點上並不明確,被告在做決定時並沒有得到「公平警告」(fair warning)說它會侵犯言論自由,所以作出決定的教職員應該免責。
我猜這大概是指原告根本沒在校內上訴時提出過「侵犯言論自由」的聲稱讓校方考慮,所以不能在法庭才提出來以求推翻原判的意思。

#23 「當時的重點就只是透過全球網路來取得資訊、與他人互動(有人稱為Web 1.0)。」

有互動就已經是web2.0吧﹖

#38 「難道我們只要在網路上公開資訊,就活該從此失去對這些資訊的控制權?難道我們不該能夠決定網路應何時「忘記」這些資訊?難道我們真會想要一個「因為再也沒有遺忘、也就再也沒有寬恕」的未來?」

但無論是哪個時代,忘不忘記本來就是由受眾決定呀。
除非你像極權政府般玩記憶抹除就是後話。

「如果我們都得擔心,關於自己的資訊甚至可能活得比自己更久,我們還敢不敢談八卦、聊經驗、罵政治?還是會開始自我審查?

其嚴乎

「嚴格說來,自願揭露資訊,責任也就得自行承擔。然而,我們常常是在自己毫無所覺的情況下,就已然揭露資訊。」

這是最大的問題,因為連有哪些資訊已被人掌握了也不知道。

#61 「執法單位儲存了幾千萬人的個人生物特徵資訊(雖然這些人從未被指控犯法),而且這些敏感、卻又可以透過搜尋取得的紀錄,大多數都絕不會刪除。」

其實是否領身份證時的指模和生物特徵護照的紀錄﹖

#88 「阿根廷作家波赫士的短篇小說《博聞強記的富內斯》(Funes, the Memorius)就設計過相關情節:經過一場騎馬意外,年輕的男子富內斯失去了「遺忘」的能力。他猛啃大量書籍,腦中累積了大量西方經典文學的文本,但卻無法參透文字的言外之意。波赫士想說的是,一旦我們有了完美的記憶,就會失去歸納、抽象思考的能力,陷入過去的種種細節而無法脫身。」

這是否因為大腦運作的需要﹖例如大腦必須把事情簡化才能掌握重點。

#278 第2章 歷史上,我們一直追求「記得」「神經細胞從接受外界的刺激到進行圖像辨認,處理了各種傳入的資訊,但是過程中會刻意丟掉極大量的資訊,這正是生物無意識進行「遺忘」的第一層。很少人知道這一點。」

因為這些資訊根本沒進入過意識。

#296 「沙克特認為:人類的長期記憶並不是像石刻石碑,刻定之後就只是檢索;而是會根據我們當下的偏好與需求,不斷重新配置記憶(也就是整理我們記得的事)。在沙克特眼中,人類的記憶是個有生命、不斷演變的結構。」

夢境某程度上也是這類工作之一,重新整理我們的記憶。只是我們的意識無法理解整理過程中產生的訊號,所以會理解成奇怪的夢境。(再加上當時外界傳入的訊號,對意識而言就更奇怪了,不少人的夢境經常有飄浮半空的情節,大概就是意識對接收不到腳部壓力訊號的解釋。)

#305 「雖然她過著相對正常的生活,但有多到不正常的時間都是陷在過去,而非享受現在。」

所以讀書多的人會比較像老人家﹖正如莊子所謂以有涯隨無涯

#334 「遠古時代十分禮遇記性高超的人,記憶力高強的人士,似乎就顯得高人一等;卡拉瑟斯(Mary Carruthers)的研究就指出,這對於求職或是躋身社會精英階級都大大有利。」

中土亦然。

#357 「也是因為有了書寫,才比較容易收稅、管理軍事及民間力量,於是推動了國家的興起。」

故神話中倉頡造字,天雨穀、鬼夜哭。大抵就是鬼神都知道「國家」出現不是甚麼好事。

#357-363 「領導人開始根據其目的,將文字收藏制度化。亞述國王亞述巴尼拔(Ashurbanipal)可能是史上第一位曾正式受過抄寫員訓練的國王,能操多種語言。他希望建立一個記憶和知識的收藏,於是每征服一座城市,就劫掠當地所有的黏土板和莎草紙,整齊存放在他的亞述巴尼拔圖書館中

所以圖書館始於劫掠﹖

#367 「正因為文字不是精準的資訊容器,每個字彙、每個句子都需要透過人來詮釋,於是我們回憶過去的時候,也不得不加入這些文字對我們的意義。」

但其實無論你用哪種媒介也有同樣問題,就算精確如拍照或影片,不同的人也會因為加入個人的意義而有不同的註釋。

「我有個法學院的朋友……如果讀了一本新書,就得決定是不是排得進前兩百大,如果排進去了,就必須淘汰原先兩百本藏書當中的一本。他相信,倚靠這樣不斷過濾、刻意遺忘,自己的藏書品質會不斷提升,讓他的外部記憶只留下真正重要、真正有價值的思想。但他沒搞懂的是人的想法會隨著時間改變,所以他用來評價、決定留哪些書的標準也就不斷改變。就算他努力了幾十年,這批藏書也不會是他「讀過最好的書」,其實只是呈現了他人生中不同階段、不同的觀點和價值觀。」

書海潛遇」亦如是。

#395 「(書的)成本卻依然居高不下。原因就在於印書要用紙,而紙張這項關鍵資源的成本仍然很高,情況幾世紀不變。」

紙的世界史》有提及這一點。(這本讀完未有時間寫介紹)

「中國,早在幾百年前就已經發明了印刷術,但用的是木版印刷,不像古騰堡用的是靈活、效率高的活字。而且中文是表意文字,比起使用字母的拼音文字,操作難度較高」

中國早就發明了活字,所以問題不是因為沒活字可用。真正問題正如後句所提,因為中文最少要準備幾千個不同的漢字活字(小學生至少也要懂一二千個,還不計重複用字所需的活字量),不如歐洲拼音文字可以用幾十個字母活字(英文最簡單用26個拉丁字母,其他最多也是加十幾個帶變音符號的字母),就可以拼寫所有詞語串成文章。就算同樣的字母在同一版面不停重複出現,可以大量複製的字母活字也比較便宜。
所以中國用活字成本相對高,古時中國人力又普遍便宜(不如歐洲黑死病後工人變得昂貴),繼續用雕板印刷也不見得很貴。所以也就沒經濟動機去採用技術更複雜的活字了。

#407 「書籍依然昂貴。如果你是富裕的律師,買本書或許沒什麼大不了;但如果是勞工,一本書可能就得耗掉一整個月的閒錢。」

所以十九世紀興起了付費會員制的圖書館。

「一直要到二十世紀初,工人生活開始因為社會改革而有改善,生活水準提升了、工時減少了,書籍和報紙的價格也才真正大幅下跌,整體讀者數量則大幅增長。」

重視工人權利和福利的好處。

#416 「十九世紀,大家都買得起書籍和報紙了,於是出現前所未有的情形,開始有廣泛共有(當然也還是有偏見)的共同記憶。當然,宗教也算是提供了某種共同的方向,但根據的多半只是一股信念﹔……安德森認為,正因如此,大規模印刷(他稱為「印刷資本主義」)的興起,促成了帝國及民族國家的崛起(帝國及民族國家都是想像的共同體)。」

大眾傳播鼓勵了民族主義的形成。

#420 「必須要有大多數人、讀著一樣的書籍和報紙,他們的體驗才能營造出同源、共同的記憶。」

所以社交媒體帶來社會共同體的解構,成為民主社會的重大衝擊吧。因為在社交媒體下各自圍爐的民主社會,更加像那些本身未有共同身份認同的多民族國家了。

#437 「電視機這種必要的收視設備已是家家戶戶普遍擁有的家電,錄影帶的費用也已不難負擔,於是人們開始不分大小事全都錄,錄影帶的消耗量明顯攀高。  然而,隨著記憶用設備的價格下降、記錄量上升,其他原本看不見的成本也浮出檯面。等到有了成百上千的照片、長達數百小時的錄音帶和錄影帶,如何有效檢索就成了惱人的問題。」

確焉,方某家中沒那麼窮之後,就買了錄影機錄下電視節目。雖然有不少節目看完就刪(於是可以重用錄其他節目),可是有不少需要保留的節目留下來之後,很難像家中書目一樣弄一個影視目錄出來。電視節目的資料和儲存位置都比書籍更難紀錄。(標準書目準則AACR2的影視目錄也是比書目複雜得多的。)

當然現在都因為磁帶難保存而劣化,大概也就不用再煩惱了。(笑)

#655 第3章 為何我們不再遺忘﹖「數位資訊則不同,沒有雜訊問題,品質也就不會隨著時間下降。」

其實也不然,正如少時在SCMP讀到的文章說,數碼載體一樣有老化的問題,更有格式太舊無法再用的問題(例如方家的《Simcity4》光碟雖然仍然可讀,但已經無法安裝在新電腦了,變相買了遊戲也不能永久玩)。只是材質老化的速度比較慢,而且數碼資訊有除錯機制,只要不是劣化得太嚴重還是可修復和轉移。
轉換格式(被淘汰的舊格式轉新格式)和轉移資料(例如從舊磁碟轉到新磁碟)還是有成本的,只是這個成本比類比資訊低得多、亦更可行。

#680 「數位資訊標準化還有另一項優點:比類比資訊更能適應未來。只要將某個訊號數位化之後,就能用標準數位資訊設備(像是個人電腦)加以處理,儲存在各種現有的儲存設備(像是硬碟),並使用網際網路傳輸到世界各地。」

如上述,格式會被淘汰,到時新電腦還是開不到。只是找到模擬器的機會比較高。

#691 「同樣也改變了人類(特別是出生在數位時代的人)接收資訊的方式。如果說在類比時代的「酷」是擁有大量書籍或唱片,數位時代的酷就是要以此為基礎繼續發展:取用各種資訊文化,再結合成全新、原創的內容。蘋果的賈伯斯曾有一句關於將此應用在音樂上的名言:「擷取、混合、燒錄(rip, mix, burn)」;甚至再加進一點自己的內容。」

Web2.0的新時代。

#702 「快閃記憶體的價格起初較高,但後來每MB儲存成本也如硬碟一般快速滑落,在2008年已經達到大約每MB只要1/3美分(約是硬碟在2001年達到的水準),這時固態儲存無須機械零件就成了一大優勢。」

#709 「目前最根本的缺點在於快閃記憶體會慢慢損耗,等到資料重複寫入抹除達十萬次左右之後,可靠度就會降低;但對於一般人的使用條件來說,這種情況不太可能發生,因此也就算不上是太大的缺點。」

但就因為快閃記憶體會「突然死亡」,所以只適合用作暫存載體,而不如機械硬碟可充當永久載體。要寫入十萬次,並沒有你想像中那麼難,尤其如果你每天都在用的話(如固態硬碟)。

#716 「短期之內,消費者要用盡儲存空間的可能性並不大。等到終於把儲存空間裝滿的時候,新一代儲存裝置又已經推出,儲存容量可能是原來的兩倍到三倍。」

話雖如此,但其實你不會有時間把舊檔搬到新裝置(如下面#728所言)。結果就是你手上有一大堆不同的儲存裝置放滿不同時期的檔案。(當然這一點在現時推廣雲端儲存下可能不再是問題。)

#728 「你必須做出一項選擇。你可以一張一張挑選要上傳哪些相片,又或是讓電腦自動複製相機裡的所有相片。或許是因為我們總覺得可以晚點再回來檢查,屆時再刪去不喜歡的相片,於是多數人有志一同,大都選擇了第二個選項。從經濟角度而言,這種選擇也有道理。假設每個人需要花上三秒鐘來看一張照片、決定是否保留;且讓我們以美國平均工資來評估這件事,你會發現,光是時間的成本就已經超過了儲存的成本。」

的確如此。

#733 「像是2008年參選副總統的阿拉斯加州長裴琳(Sarah Palin),就是用私人電子郵件帳戶,來規避公文紀錄保存的要求。」

其實不應讓這種事情發生。(雖然雙方陣營都有發生同類的事,例如希拉里,但是否「為了」逃避公文檔案保存的要求就不清楚了。)

#742 「(1996-2000年代初) 這些服務的資金來自廣告,特點在於:大多數都是由中央伺服器提供有限的免費磁碟空間,而這點與儲存成本下降的趨勢也一致。」

其實當時的如意算盤是希望你爆滿後付費繼續使用吧。(現在的Apple和Google仍是如此。)

#766 「商業及國家興起之後,必須設法輕鬆準確進行檔案歸檔和檢索。而歸檔系統的設計,就類似圖書館的兩階段做法:檔案先放在檔案櫃裡,每個檔案再依名稱、日期或類似標準加以排序。這樣的系統能讓人快速檢索資料,但管理成本很高:如果歸檔的時候一不注意,就可能永遠找不到;而且因為歸檔系統的架構很難事後調整,因此一開始設計就必須十分謹慎周延。」

的確。所以當年我回大學幫醫學院教授跟進研究工作,他聘請在下的原因之一(當然我想最主要是人工便宜),就是我有圖書館工作經驗。
老闆有一份研究是電力公司贊助,分析空氣污染對健康的影響。之前已經有研究助理收集了一大堆相關論文(好像有百多份,印出來要幾個黑色大資料夾才裝得完),問題是他需要找人把這些論文分類整理,然後才能寫報告。
結果我要先跟他商談,了解他的報告要怎樣寫,然後才按其需要,把論文按空氣污染對各種疾病的急性、慢性影響分門別類放好。甚至有些論文橫跨不同領域要預留指示以免遺漏。最後才當「高級伴讀書僮」每天拿出某一類相關論文陪他寫報告。

#784 「隨著新的數位檢索工具克服了傳統類比儲存的順序組織,搜尋時間大幅縮短,但呈現在螢幕上的結果其實都被抽離了原本的情境脈絡。相較之下,傳統翻找檔案的方式能夠體驗較多情境脈絡」

斷章取義,古已有之,於今尤烈。

#794 「一直要到出現全球數位網路,才消除了實體位置的限制,只要連上網路,就能存取連結到全球數位網路資料庫中的資訊。這從根本上改變了搜尋和檢索的經濟性,要取得資料,代價原本是得花上時間和金錢,親自跑一趟,現在則換成網路通訊成本(這可低得多了)。」

早年要使用資料庫,還要跑去圖書館(當時只是一堆光碟放在圖書館自己的伺服器上)。後來資料庫都上網,用密碼就可登入。

「網際網路加深了這種變化;遠端存取的通訊費少到幾乎可以不計,更讓可能的客群從商業實體擴大到幾乎所有一般用戶。」

其實要多謝科網泡沫令通訊基建「過度」投資降低了費用。本來並非如此,例如香港網絡早期用戶都要付PNETS,所以只有相當技術和閒錢的人會上網。方某中學時就已經可以在圖書館上網,但只能間中使用。等到進大學後,可以用大學撥號免費上網,才瘋狂上網。結果到那時候,中學時開設的yahoo電郵帳號已經因為太久沒用而無法登入了。

#1038 第4章 權力和時間﹕拉大資訊貧富差距「幾千年來,人類一直生活在「遺忘」的世界,不論是個人行為、價值觀、或是社會的機制流程,都是基於並反映這樣的事實。」

正如很多其他問題一樣,都是源於我們的生物演化跟不上我們創造的社會變化速度。這個論點不斷重複出現。

#1042 「這種喜歡把資訊掌握在自己手上、維持資訊優勢的態度,可能來自近幾十年來文化的養成。但這件事情的歷史也很有可能要悠久得多。」

很明顯至少有幾千年啦。文句結構上應該真的是「近幾十年」,但道理顯然不止。

「馬丁.路德將聖經譯成白話德文之後,民眾可以自行閱讀聖經,不再需要被動接受教會那些號稱「知情人士」說的一切(而且,犯了錯之後可以直接向上帝告解,無須透過教士,於是教會開始聽不到那些重要的小道消息)。結果就是削弱了天主教教會的權力,使世俗的民族國家有機會興起。」

天主教會之所以對宗教改革反感,可能這才是重點。

#1074 「在可接取性和耐久性兩者結合之後,人們再也不能逃避自己的過去。過去就這樣如影隨形的跟著你我,任何人只要有網路就能接取。」

無所遁逃於天地之間。

#1102 「因為我們總是不斷在記憶中重新構建我們的過去,經過一段時間,我們對於某件互動的記憶,必然不及那些資訊富者手中關於我們的數位記憶,最終就是使得我們自我否定自己的過去。資訊隱私專家早已提出一種看法,認為人必須保留對自身資訊的一些控制權,才能擁有能夠定義自己的必要空間。」

資訊可用於「自我定義」這一點,反而是我們討論私隱時很少留意的部分。

#1108 「如果我們不確定自己的言論會被誰、以什麼方式運用,就只能先假設最壞的情況,也就是認定任何評論都會被用來造成最大的傷害。」

#1123 「如果今天傅柯還在世,他必然會認為數位記憶正是控管圓形監獄的有效機制:一方面支持了社會與階層組織的控制力,一方面也從社會與階層組織當中得到支持,進一步鞏固和深化現有的資訊權力不對等分布。」 

現在網絡上正是如此,所以不少朋友寧願匿名或化名留言。這甚至不單是怕政權報復,就算在自由社會的人上網談日常小事也一樣。
但這種安全感其實也不穩固。畢竟網民之中的「網絡神探」出名起底能力強,除非你有間諜級匿藏個人背景的能力(又或者是受保護的特權人士),否則如果自恃化名就隨意說話,有朝一日也可以突然被揭露「那個人就是你」。

結果你就只能像某些口密的朋友般,乾脆在網上匿蹤,或者只能貼些風花雪月的帖。

#1159 「遺忘還可能是學習的重要過程。組織學習專家史塔巴克(William Starbuck)就認為,想學習全新的事物,得先放下老舊的事物。」

金庸小說的男主角﹖

#1180 「我們任何決定所根據的資訊都不可能完整:在類比記憶的世界,資訊的遺漏是隨機發生,而在數位記憶的世界,遺漏的卻必然是那些無法以數位形式儲存的資料──這是一種系統性的偏差,不只會影響我們對事件的理解,甚至還可能給動了手腳。簡言之,因為數位記憶只會放大數位化資訊的重要性」

正如現代的量化管理主義往往就只顧追量化的KPI,忽視無法量化的方面。如果只是管工廠還OK,管教師社工醫護這類「對人」的工作,就容易變成捨本逐末。

#1201 「我們面臨的挑戰很可能是:有了太多難以抹滅的記憶之後,使得我們待人處事太過嚴苛、無法寬恕,於是讓某些人選擇走向極端,完全放下過去,只活在當下。」

現實可能已是這樣,你看某些「歷史由我開始」的年輕人﹖不過他們比作者設想的更糟,因為他們對過去無知,卻沒活在當下,只懂用自己的時代角度去幻想歷史胡亂指責前人,錢穆所謂以時代意見抹煞歷史意見是也。(試想像指責孔子沒提倡民主、蘇格拉底沒反對奴隸制之類,完全漠視每個人思想受其成長環境的限制,像看了少年動漫就以為少年有能力拯救地球一樣荒謬。可惜這種「歷史中二病」患者舉目皆是,而且還可以成為KOL。)

#1334 註56「有些人可能認為,可以用科技來確保數位記憶的真實性。雖然有可能,但現在方法還不明,而且又要如何確保那些驗證真實性的人,未受數位記憶影響呢?

反正在舊時專家一樣可以收買或收編。

#1443 第五章 六種對策﹕個人的、法律的、科技的「數位記憶很少在當下就帶來負面影響,而是會在未來的年歲如鬼魂般揮之不去。但要讓人為了未來可能的麻煩,就放下手中具體的好處,絕非易事。」

正如很難讓人(尤其窮人)向保險或公積金供款。套行為經濟學的論調,就是人類對未來的損益有很大折讓。

#1463 「最早提倡資訊隱私權的人士是波士頓的兩位律師:沃倫(Samuel Warren)和布蘭戴斯(Louis Brandeis,後來成了最高法院大法官),他們在1890年於《哈佛法律評論》期刊發表〈隱私的權利〉一文,基本上就是希望能認定某個案例是侵犯隱私。」

原以為是1980年誤植,但一查之下真的是1890年。

#1481 「在過去三十年間,雖然美國國會已經針對更完善全面的資訊隱私法案進行辯論,卻沒有激起廣大的群眾迴響。政治學家或許有個大致的解釋:能夠通過立法,常常背後是有組織明確、動機高昂、資金雄厚的團體支持,而且大多數公民的損失小到讓他們不會起身反抗。但全面的資訊隱私立法卻正好完全相反:大多數公民可以得到少許好處(但少到不構成起身支持),但那些動機強烈、資金雄厚的團體卻得擔心損失慘重。」

如果連槍械管制這種關乎人命的好處也不夠大到足以推翻既得利益,私隱權就更不可能了。

#1492 「這樣的控制權要落實,就必須確保不只是現在、就算在未來也要能有效執行。……後來納粹入侵荷蘭,掌握這些人口登記,就無情的運用這些資料,從數百萬荷蘭公民中,找出猶太人和吉普賽人,進行迫害和謀殺。正因為人口登記資料完整詳細,猶太人在荷蘭被納粹找出、驅逐和殺害的比例(73%),要遠高於比利時(40%)、法國(25%)及任何其他歐洲國家。」

清點每一個人》有詳細描述。

#1506 「絕大多數年輕人都無視著作權法,自由自在的分享內容。」

其實也不只年輕人,中老年人一樣互相傳盜版影音檔。只是年輕人沒錢,更易依賴盜版而已。

#1525 「相對於那些必須能聽能看的著作權內容(也就會有「未加密的時刻」),個資通常是用來「輸入、再進行資訊處理」,大多屬於更容易受到保護的資訊處理範疇。」

不一定,例如起底的人可以先見到,然後到其他地方再講出去。(反之電影和音樂你要不在現場欣賞、要不就必須整個檔案複製才能在其他地方欣賞。)

#1561 「適應,本來就是我們求生存和生活的基本機制之一。這會讓我們得以和改變重新同步(畢竟改變本來就是自然界最基本的概念)」

問題不在於「人類不會適應」,而是社會變化太快,人類的身心變化速度永遠追不上最新發展。

#1574 「至於歐洲人權法院最近則以罕見的匿名方式裁決:不得永久保留無辜者的DNA資訊。」

見到這句令人懷疑,因為法官裁決總要具名,沒可能匿名裁決的(這宗案也沒敏感到法官不能具名,而歐洲人權法院的法官名單本來就不是秘密,所以沒可能匿名)。
原先我懷疑是「匿名上訴」之誤(上訴人為保私隱或可匿名),但從註釋找回原本的BBC報導,這宗案件有兩個英國上訴人,一位已具名,另一位青少年用化名S,既然有人具名上訴也說不上匿名(法庭報導青少年案件用化名也不是「罕見」)。
大概是有人(懷疑是譯者)把「unanimous judgement」(一致裁決)誤當成「anonymous」(匿名)。法院十七位法官全部意見一致倒算得上「罕見」了。

「例如歐盟隱私指令第6條便規定,國家法律必須確保個人資料「保存之形式得以識別資料主體之時限,不得長於資料最初蒐集目的及後續處理之所需」。」

那麼檔案館怎麼辦呢﹖他們保留的都是政府部門不再用的檔案。大概有免責條款﹖

#1593 「因為目前執法機構還無法蒐集夠多的相關資訊,儲存能力也常感不足,因此似乎就需要有新的資訊保存法規,強迫由民間機構來留存相關資訊,以便執法機構未來有需求時可取得。」

如此立法更大的理由是政府儲存資料會令民眾更擔心吧。規定民間機構各自儲存,至少政府有需要時還要辦些手續才拿到(機構也有機會反對),而非讓政府一下子拿到所有資料,然後自己嘗試整合一個超過資料庫看看有甚麼關係跑出來。

#1629 「數位記憶還是會漏掉一項(至少到目前為止)無法數位化的重要資訊:我們的思想。如果數位記憶只能記錄外部資訊、記錄不了腦內的思想,數位記憶就還是不可能完整(至於熵原理限制的儲存量就更不用提了)。」

我想到的倒不是甚麼熱力學原理,而是《大人的地圖學》(其實還有其他書)提及波赫士的寓言﹕要製作一幅「包羅全國鉅細無遺的地圖」,唯一方法就是製作一張跟全國實物一樣大的地圖,但這樣的地圖已經無法使用(因為它直接蓋在全國之上啦)。同樣地,如果你真的要紀錄世上的「所有事」以保存事件完整脈絡,唯一方法就是複製整個宇宙。否則任何方法必有省略之處。

#1639 「另一種數位禁慾方式,是讓個人使用多重線上身分,這些身分無論彼此之間或是與現實世界的本人都沒有連結。這樣一來,個人就能將各種資訊流分門別類,資訊業者也就更難結合各種個資而看到個人的全貌。」

雖然也有不少人這樣做,多重身份的問題就如前述(#1123)的匿名或化名,的確能讓商家較難拼湊全貌,但對於消除對「說話後不知多少年後被批鬥」這類恐懼,其實作用不大,因為「網絡神探」(甚至政權)自有能力幫你拼起來。

「還是有(a)對特定部門的資訊隱私權,涵蓋許多資訊接收者……(b)各州州法,保障特定情形的資訊隱私權,(c)回歸到一般的隱私權法。……像這樣東拼西湊的資訊隱私權,想必會讓民眾一頭霧水,不知道自己究竟在什麼情況下能夠享有什麼權利。」

權力分散是聯邦制的優點,法出多門卻是聯邦制的弱點。

#1841 第六章 重新遺忘﹕運用「到期日」機制「其實所有方式的核心概念都相同:要讓我們面對(等於提醒我們)「資訊的有限性」,也就是資訊必然與某個時點或是期間連結,等到時間過去,大多數資訊也就失去價值,像是昨天的報紙、或是我們已經聽過多次的老笑話。」

但舊報紙也會有價值,歷史研究者就會想翻舊報紙找資料,所以把舊報紙和舊資訊完全刪掉也不成。或者我們需要的不是完全「刪除」數碼記憶,而是增加讀取舊數碼記憶的難度。

#1850 「像這樣以法律來規範軟體功能,過去早有先例:為了保護資訊隱私或是智慧財產,法律已要求軟體廠商加入某些機制或程序」

但回到 #1481 的立法動力問題﹕這個提案沒人有錢賺,誰會大力推動﹖

「如果能採用到期日機制,就能淘汰不再有價值的資訊,使資料庫的品質大為改善。」

也不能斷言舊資訊就低價值,當然「通常」舊資訊的價值低於新資訊。

#1881 「我們也可以設計另一種新的後設資訊標籤,讓網頁作者自行設定允許搜尋引擎製作索引或快取的時限。……網路搜尋引擎甚至也可以在搜尋結果旁邊顯示到期日,做為一項粗略但有用的指標,讓使用者判斷這項結果的可能價值。」

那麼內容農場設定的限期恐怕是「永遠」

#1929 「也許只需要再複雜一點點,就能讓到期日機制更接近大腦記憶和遺忘的方式。」

「又或是如果想要找較久遠的資訊,必須有更多的搜尋線索」 

可能先讓存取更慢、手續更複雜,再之後才刪除。
後者反而令人想不到可以怎樣做。

「我們也可以將某項數位資訊,例如某個檔案,慢慢模糊化處理,隨著時間逐漸刪除」

例如人工加上雜訊﹖

#2025 第7章 數位時代,「刪去」是必要的美德「這樣一來,我們才會活在現在,而不是一直放不下某個已經愈來愈與我們無關的過去。因此,要有遺忘,社會才能對成員寬容,並有改變的能力。然而,數位記憶正是危及了遺忘的這些重要功能,也就影響了人類學習、推理、及時行動的能力。此外,這也可能造成物極必反,讓人決定要完全無視過去。」

我們見到有時「文明古國」(不限於天朝,其他文明古國與之焉)的子民特別多詐偽,懷疑也是因為「歷史記憶」太多令我們太「鬼靈精」﹖

星期六, 4月 13, 2024

政治檔案會說話


政治檔案會說話》,陳進金、陳翠蓮、蘇慶軒、吳俊瑩、林正慧,台北﹕春山,2021

以前是隔岸觀火,現在是反照自身。

對於二二八和之後的「戒嚴、動員戡亂」下發生的政治案件,台灣民主轉型後陸續被挖掘和整理。其中檔案開放更讓學者和公眾有機會研究冤案的製造流程和責任誰屬。

就算不像書中所言主事官員立場偏頗、或者情報機關為保密故弄玄虛,官樣文章本來就不易讀。檔案本來就為行政而設,並不便民,搜索和閱讀檔案亦需要有技巧。有些歷史學家/學生受過訓練還好,一般人讀就很易頭昏腦花,不知從何開始、又容易誤讀誤解。

本書由國家人權博物館和民間真相與和解促進委員會牽頭,幾位學者介紹檔案運用的技巧、從何搜索、如何搜索、如何解讀檔案。並附上四位「事主」的檔案分析,示範如何透過檔案釐清事實,和解讀檔案時需留意的地方和陷阱。

雖然學者還指出現有的檔案開放制度有很多不足之處,平衡真相釐清和人權私隱方面亦時有衝突,但至少有個開始。有真相,才有和解的可能。
而姑勿論香港根本連檔案法都沒有,就算有檔案保留又開放了,你也要懂得讀才成。

(方某人其他書評書介)

(如果閣下有興趣讀電子書,經本文連結 https://moo.im/a/4euDGN 購買,本人將獲得平台回饋。當然看倌不一定要經這條連結買的。)

---

筆記,或挑骨頭﹕

#147-158 第一章 政治檔案開放之路「二○○二年施行的《檔案法》,是為「健全政府機關檔案管理,促進檔案開放與運用,發揮檔案功能」;並規定政府檔案至遲應於三十年內開放應用(第二十二條)。但立法院隨後又通過《國家機密保護法》,規定「為確保國家安全或利益而有保密之必要,對政府機關持有或保管之資訊,經依本法核定機密等級」;「涉及國家安全情報來源或管道之國家機密,應永久保密,不適用前條及檔案法第二十二條之規定。」另有《個人資料保護法》,則規定政府機關應保護個人資料,「避免人格權受侵害」、「應尊重當事人之權益」等等。《檔案法》、《國家機密保護法》與《個人資料保護法》幾種法律相互競合,令檔案管理局公開政府檔案的工作左支右絀。」

其實列為國家機密亦應定期檢視,以便重劃等級。

#205 「政治檔案公開雖然有助於追查白色恐怖時期政治案件真相,但必須謹記,檔案不等於真相,檔案公開與歷史真相還有遙遠的距離。尤其,政治檔案是威權時期統治機關所產生的文書,其中包括刑求逼迫下取得的筆錄、自白書;軍警情治機關以偏見、扭曲觀點所做的記載;特務或線民侵入私領域做成涉及個人隱私的監視報告等。」

重點切記。

#258 第二章 政治檔案哪裡來﹖「國民黨在國共內戰中失敗後,蔣介石認為黨組織不振是失敗的主因,一九五○年在臺灣進行黨的改造」

某程度上沒錯,畢竟被中共滲透得很誇張。

#527 第三章 政治檔案哪裡找﹖「二○二○年,資料庫上線後不久,新聞媒體「READr」將臺灣轉型正義資料庫的資料擷取出來,分析後得到許多過去個案研究無法概覽的加害體制圖像:男性有一萬○二六九筆,女性四三九筆;省籍來看,本省與外省各占五五與四五%,以外省人在臺所占人口比來看,白色恐怖並沒有明顯一方受害的情況,外省人涉「匪嫌」而遇害的機率反而較高

意料之外,但或者又意料之內。意料之外是跟本省籍對二二八的悲情相比,外省人多是承受怨恨的角色。意料之內是外省人大多是內戰後到台灣,跟對岸有不少關係藕斷絲連,自然更容易被懷疑是「匪諜」。可見就算國民黨真是倚重外省人,能獲得信任的外省「精英」階層人數也不多,其他外省人只是處於「方便使用但隨時被懷疑」的邊緣,但對前者的怨恨就延至所有外省人。以往對二二八的描述通常都是「省籍矛盾」,但真正矛盾的其實是威權政府和一般小民。

#601 「許昭榮的補償卷宗有他對這三段經歷的陳述與感嘆,只因自己「個性剛直,重義輕利,不願入,導致一生坎坷,連續挫折三次,浪費三十年的黃金歲月,時也,命也!」」

「黨」,不知是當事人原文寫了簡體字還是作者寫成簡體字。

#659 「黨國體制下,屬於「黨」所產生的文書,無疑相當重要」

就算是民主社會,現在民進黨的檔案,幾十年後對研究也相當重要吧。(何況是黨國)

#1024 第四章 政治檔案解讀新手教學「敏銳的讀者很快會聯想到,臺灣站究竟刪節或調整了哪些內容?圖4-10即是臺灣站刪改「陳向前」情資原稿的情況,劃線刪除處即是臺灣站認為沒有必要呈報南京局本部的內容。刪除的部分,不少是在解釋人民在二二八採取行動的情況及背後原因。例如,一九四七年三月二日臺中市民包圍前臺中縣長劉存忠官邸,其因是「平素貪污,炙膾人口,民眾憤怨積久,乘時前往其宿舍搗毀,並將劉某毆打」;另外,「民眾維持治安精神堪謂可嘉,其搶掠劫奪不見發生」、「對財物均運出焚毀,無敢私匿一物,民主精神表現」、「較之國內暴變,民眾維持治安程度優良多多」這些對群眾作為相對正面的敘述,也不在臺灣站摘報之列。臺灣站僅留下政治措施失當,民生未能安定,至於「民怨深埋,青年等均抱非流血難爭到民主之決心」同樣被劃刪,刻意放大「奸黨煽動」的作用。」

本省人對外省人的怨恨和台獨思想就是這種只顧揣摩上意的上級惹出來。可惜的是同類事情不只在一時、一地發生,直到我們這一代還有機會見識

#1320 第五章 政治檔案類型介紹「甚至認為「檢舉無財產之匪諜案件,每有案情重大,而所得獎金額反甚低微者」,建議獎金應予提高,以資激勵。」

這其實會製造道德危機,令線人為錢製造冤獄。

#1330 「對政治受刑人而言,軍人監獄的環境潮溼而擁擠,作息上每天供應兩餐伙食,放封兩次。」

應為「放風」,有讓人透氣之意,不限於囚犯。雖然他們教育部詞典亦收「放封」,但「放風」才是正字。(反正教育部字典收了不少別字)

#1608 第六章 蔡懋棠案﹕判決轉折抽絲剝繭「蔡懋棠或許還不知道他史丹福中心的臺語部同事魏益民是警總的內線。警總決定將蔡懋棠裁定感化,主要是考慮如果採取軍事審判,必須傳訊魏益民到庭作證、對質,否則單憑自白定罪,法律上站不穩,但這可能使魏的內線身分曝光,難以運用。」

對岸審理就簡單得多,反正他們自己說站得穩就成。

#1639 「誰敢物議警總呢?其中之一是史丹福中心的外籍學生向警總申請開庭旁聽,外國在臺記者同樣有此請求。若裁定感化,則不須開庭,便無旁聽機會,但外國人又將認為本案有不可告人祕密,攻訐是祕密審判。這使得警總最後決定本案裁定交付感化,同時宣告以保護管束代之為宜,「以減少不必要困擾」。」

可見外國勢力的用處,和為何有人那麼忌憚「外國干涉」。

#1674 註9「軍方單位燒資料,其來有自。最令人痛心的案例之一,是雷震在獄中埋首十年的所完成的回憶錄,出獄前夕竟保防室主任華新春,下令將已完成與未完成稿件全部搬走、查扣,認為回憶錄對孫文、蔣介石多所詆毀,直至雷震出獄,獄方仍不發還回憶錄,擱置在警總十八年。1988年4月監察院準備調查雷案時,回憶錄書稿突然「現蹤」,警總發現積壓多年的雷震手稿,將文稿退回國防部軍法局,軍法局再移送給國防部新店監獄,建議該新店軍監依《監獄行刑法》處理,4月30日獄方召開監務會議,以「文稿內容甚為不妥,尤以攻訐三民主義、詆毀國父為最……且其中又誣衊先總統蔣公及為匪張目,故意醜化政府,如予發還,極易為有心人士利用,發表足以混淆視聽,造成思想污染」。於是將多達四百萬字的書稿,在監獄內架爐焚燬。」

官方焚書,一直有之。

#1751 第七章 崔小萍案﹕真假交織的判決書「疲累的崔小萍為了釋疑,甚至主動拿出她的日記,證明自己未曾到過延安。提供日記的舉動其實讓調查局有更多材料可以運用,但當時她並未意識到危險。」

老實人往往沒想到,官方並非懷疑你有罪,而是認定你有罪。所以無論甚麼材料他們都會剪輯成你有罪的樣子。

#2027 第八章 蔡孝乾案﹕投降的中共地下黨領袖「可見到了一九五八年,已升至少將參議的蔡孝乾,官方對他仍有疑忌之心,無法放心讓他自由行動。」

正常呀。畢竟政府只是養著他利用而已。

#2320 第九章 許席圖案﹕被逼瘋的愛國自覺青年「周順吉等人被判刑的關鍵應是「推翻國民政府」。事實上,「國民政府」是國民黨訓政時期的產物,一九四七年底行憲後已不存在,推翻一個不存在的「國民政府」,竟然讓幾位二十餘歲的自覺青年被判無期徒刑或十五年徒刑,大好的青春歲月就在牢獄中度過。」

雖然嚴格而言「國民政府」的確是指行憲前的那個,但解嚴前民間叫法還是會把國民黨治下的中華民國政府稱為國民政府。至少我小時候有這樣聽到。

#2511 結語「威權統治時代的加害者與協力者幾乎全部隱身,甚至有人在新時代操著進步的語言、收割政治利益」

除非搞一場革命把原有當權者統統掃下台,否則在當權者讓步妥協下的改進,很難避免這樣的情況。

#2520 「蔡孝乾案中可以看到國共鬥爭的殘酷,中共地下黨主要幹部自首自新後被高度利用、擴大逮捕,自己卻也長期受監控失去自由。」

至少不用死,但被他們吸收後又出賣的黨員就可能要。