The builder's life #6 - 最初的方法論: Basestone & Stellar 詞彙與其比例帶來的洞見
Jul 11, 2021
Totuslink 是我於 2020 年夏開始的實驗,那個時候它還叫作 Hololink。之所以取用這兩個名字是因為 Totus 和 Holo 雖然尺度不同,但都有全面、完整的含義。我期待這個軟體能在資訊與知識的場域帶給人們這種感受。(由於 Hololink 已經被其他公司使用,因此我於 2021 年開始使用 Totuslink)
確切而言是從哪個時候開始這一系列的思考的,我已經遺失座標,那時邊寫著只完成三分之一,關於早餐店,不知被誰殺害的貓的故事。邊揣摩什麼是變頻器,馬達如何被驅動的,以及思考自己為什麼漸漸跟不上這個世界製造資訊的速度。最後一個問題一絲絲地排擠我對於其他問題的熱情。被無法清楚定義面貌的使命感推進,我開始研究如何面對資訊世界不斷膨脹,人卻無法跟上的困境,找尋減少人們整理資料,產出知識的負擔的方法。
2020夏,Hololink 最初的方法論是使用簡易的斷詞系統,去除連結詞、語助詞等等不具文章構築意義外的字詞,以及形容詞、副詞等需要依附名詞才能構成意義的字詞。最終將剩餘的名詞整理成兩種分類,Stellar 和 Basestone。
Basestone 如其名,代表意義穩定,不易更動的詞彙。例如在各個領域中的專有名詞、人名、地名。弦論、村上春樹以及品種為雪納瑞的狗。Basestone的字詞是我們於該文章之中最確知的事物,它宛若地圖上的各類標誌,綠色的箭頭代表可以通行的路線、紅色的叉叉代表因為風災而阻斷的路線。因為這些標誌我們在文章中才不會迷失方向。
然而 Basestone 詞彙雖然簡單直白,定義明確,裡面卻有著非常多社會約定成俗的含義。例如專有名詞本身就有著許多社會強加的暴力。專有名詞是如何被定義出來的?是由誰來定義,有經過被定義的客體的同意了嗎?例如只因膚淺的定義而指稱無性別者為男性,無視他們的需求與生命經驗,簡單卻暴力地強加其上。Basestone 類的字詞具有力量,但是其力量總是被於社會上佔優勢者濫用。
Basestone 使用過多也有寫作方法論上的問題,這類文章讀起來就像是劣質的論文,充滿索引與看似說法得當,實則胡謅的言詞。以我的語境而言,這類文章並沒有在最初考慮讀者閱讀與理解的方式,逕自將個人的性格與意念凌駕在這之上,他從中獲得的並不是雙方的理解,而是為了建立個人的權威。
Stellar 是與 Basestone 相反的詞彙,它的意義可能隨上下文變動,更可能因為使用者不同的使用方式產生不同的效果。像是水壺、樹木、沙灘、文章等等。這類詞彙乍看之下有明確指稱某個事物,但在深入思考之後會發現他們的指向都不夠清晰,例如水壺是哪一個水壺?樹木是哪一種樹?沙灘位在哪裡?文章是指哪一篇文章,端看使用者如何去闡述。
Stellar 類的文字構成了一篇文章的主體,每篇文章大概有 80% ~ 90% 的比例是由 Stellar 的字彙組成(我們利用當時的系統針對各類新聞、文章做的分析得出的概略的結果,母數不多但點到為止。隨後我們會以 Totuslink 的架構進行更多的分析),透過這些字詞我們大略掌握了文章本身想要傳遞的模糊概念。這些概念並沒有清楚地指涉某種定義完善的事物,有些文章因為目的在於闡述根本還沒有定義的事物(尤其常見於小說或哲學論述),它必須大量使用 Stellar 類的字彙來填補與讀者間概念的落差。
Basestone 和 Stellar,兩者的比例與該篇文章能否帶給讀者資訊並不成正比,資訊的價值與深度並不是以某一方作為主體就可以達到。Basestone 和 Stellar 的方法論甚至在最初就剔除了同樣能帶來大量資訊的副詞與形容詞,單純以這種方法論來決定資訊量的多寡無疑是種傲慢。
這個分類方式指出的洞見並不是我們應該如何找到黃金比例,而在於:「我們如何自發性地覺察當前閱讀材料中,文字構築的方法。」並對其有意識。
Hololink 的目標正是將這種對 Basestone 和 Stellar 詞彙的觀察轉換成每個人都可以使用,並從中獲得洞見的形式。最快的方法就是構築出一個簡易使用的系統,並且將這類的維度介紹給人們。
我們最終採取了單頁網頁應用程式搭配瀏覽器擴充元件的組合,在你想要分析的網頁中打開擴充元件並且上傳,資料會傳送到我們的資料庫,並於那邊進行 Basestone 和 Stellar 的分析。隨後輸出成一個非常複雜的 force-directed graph。白色大圓點代表網頁的網址,藍色圓點代表 Basestone,其餘黃色小圓點則代表 Stellar。
端倪 Hololink 最初的模樣時,乍看之下會認為其價值不言而喻,然而思考一陣子之後會不自覺地走入迷宮似的,對它究竟想要闡述什麼感到疑惑。在尋覓 Basestone 與 Stellar 的架構時我早已預料到這件事並不會那麼簡單,即使只留下名詞,一篇文章還是可以輕易超過上百個甚至千個不重複的單字。把這些資料一股腦呈現在人們面前的結果是我們徹底無法減輕他們的負擔,反而是加重了。所謂的資料保留了他的特性,以接近原始的狀態放到人的眼前時,它直接面對的是人們的焦慮。人們則差點直覺說出那個字。
資料本身,其價值、意義大多是比較出來的。在資訊的世代,我們面對的是一群本質上或許根本沒有意義的虛無物體,透過與他者連結,與眾多看似有意義的事物連結來產生意義。舉例來說,比喻這個方法論從根本面來看待即近似這樣的行為,將對我有意義,對讀者可能沒有意義的指涉物,連結我清楚知道對讀者有意義的事物,藉此傳達感受。資料也需要如此,藉由某種我定義完善的基準,來量測另外一群資訊。這也是 Stellar 和 Basestone 根本的目的,找到運作良善的尺規,幫助人們丈量世界。
然而這也是它的問題,拿著同一把尺想要丈量世上普遍存在的事物。卻只是製造出更多的資訊,而沒有減少並篩選出真正有價值的資訊。要讓事物複雜很容易,要簡化複雜的事務卻很難。
放下 Hololink basestone 和 stellar 的方法論不久之後,我藉由一位好友的眼睛探詢到了一款名叫 Infranodus 的產品,它的概念跟 Basestone 和 Stellar 接近,都是藉由斷詞並分析其中字句的關係來提供人們洞見。由於事過境遷,得知這款產品時我感受到的不是強烈的驚慌,反而是種淡然,也是藉由這次的經驗,我知道我的方向並不在此。我發現重點不在於找到另外一種尺規,而在於探詢我們陳列資訊的方式,到底出了什麼問題,對這個問題的重新設問,成為了 Totuslink 的開端。
致謝
謝謝晏如、靜智、示家、子宇閱讀這篇文章的初稿