網頁

星期二, 3月 04, 2008

Wikipedia - 學習的好工具

最近在學 Pattern recognition(模式識別),深深的感覺到這真的是一門非常精深的學問啊。

人腦真的是比電腦優秀太多了,雖然效率有些差,出錯的機率也比較大,但根本就不需要一行行無機的程式編程,就可以輕易的判斷出需要的資訊,並做出必要的鑑別,反觀可以實用化的模式鑑別程序,首先必須要先利用群體取樣收集的資訊來做出統計,再一步步的建立起必要的演算法,最後才能找出最適當的分類器(classifiers)。

我看了幾篇應用相關理論的論文之後,感覺似乎在生物或是機器學習的領域應用很廣,只要能夠適當的應用幾個演算法加在資料運算當中,就會是一篇很強的論文,所以如果能把這東西搞懂,應該就可以輕易稱霸一方吧^^!

基礎理論的學習總是非常辛苦的,而在學習的過程中,Wikipedia 給我的幫助真的很大,很多教科書看不懂的名詞或是演算法,透過 Wikipedia 的解釋,好像就豁然開朗,所以我現在每進入一個新的章節,都會先到 Wikipedia 好好的領悟一番,再回頭去看教科書就比較容易吸收了。

不過讓我有點洩氣的是,中文維基的相關資料總是很少,雖然我並不特別需要中文的翻譯,但一方面總想知道中文是用怎樣的翻譯,再另一方面也可以加深學習的印象,可惜中文的條目不是欠缺,就是不完整的部分翻譯英文,反觀日文或是德文的相關條目,雖然主要也是翻自英文,卻相對完整許多。

聽(老師)說這類將資料分群與模式鑑別的課程是愈來愈熱門,從我用的教科書作者的網站上看到,台灣國內許多有名的工程學院有使用這本教科書上課,不過我不知道學生選課的情形,很難做出是否熱門的判斷,但從維基條目的欠缺,我主觀的以為,與這門技術的應用領域相比,這門科目在台灣應該沒有真正建立起相應的基礎研究規模。

這樣判斷或許過於不客觀,但知識的成長其實與知識的分享、取得的便利性成正比,雖然Wikipedia 的正確性與公正性一直備受懷疑,最近還爆出主要協同創辦人發生感情花邊,還利用 Wikipedia 發佈不公正言論的新聞,但作為一個全世界最大的知識分享資料庫(英文資料庫約有兩百萬條),就算是部分在 Wikipedia 的條目有些問題,教授們也有警告學生們要小心使用,但其學術地位依然是難以輕易動搖的。

相對於兩百萬之多的英文條目,中文條目的成長一直相對緩慢(至今只有約16萬條),只有在政治風暴中,偶爾被當作抨擊對手的工具來博個版面,對於基礎理論的學習不但沒有正面的幫助,反而讓中文維基蒙上不公正的陰影。

我知道台灣也有許多人利用 Wiki 系統來編寫說明資料或是專案開發,這是分享某個特定主題系列的好方法,但可惜的是,會這樣做的只是非常少的一部分人,而且相對於維基百科接受匿編寫,這些獨立的 Wiki 多半還必須另外申請帳號加入編輯,此外,這些獨立的 Wiki 往往並沒有與百科建立連結,更是增加了查詢的困難。

我曾經寫過一篇與維基百科相關的文章,「把知識傳出去」,主要是鼓勵留學生朋友們多利用 Wikipedia 的好處,把在地的留學知識集合起來,一年多觀察下來,國外大學的相關條目依然是非常缺乏,到底這是因為美國人比較勤於分享,而中國人比較慣於藏私嗎?

有朋友告訴過我,這都是因為編寫 Wiki 的系統還需要學習,又沒有輔助的軟體幫助,從這觀點看來,就只是單純的懶囉?唉,中國+台灣可是有多過美國 5 倍的人口耶,懶的藉口還真是一點說服力也沒有,也難以讓人理解啊。

其實這篇只是想碎念一下在學 Pattern recognition 時,感覺到 Wikipedia 與 中文維基的差異,我是真心的期待真的有這麼一天,中文維基的條目數量,可以遠遠超過英文的 Wikipedia,在資訊分享上成為世界的霸主啊。

 

3 則留言:

  1. WIKIPEDIA的確為一大好物也~

    雖然教授常常就我們別用= =|||

    用了也不能拿來當注腳....

    好糾結阿~~~~

    回覆刪除
  2. 我同意你的看法!
    我也常常在作報告或讀書的時候用wiki
    雖然不能當做真正的source
    但是寫的淺顯易懂
    很實用!

    ps.最近不知道為什麼
    bloglines每次抓這邊的RSS都是舊的
    XDDDD
    完全讀不到新的
    不知道重新輸入地址有沒有比較好

    回覆刪除
  3. To Amo
    因為寫的人不是同一個,而且正確性難以評估,所以不能直接用,但 Wikipedia 也有參考來源,可以連過去瀏覽一番,再順手收下來,這多少也有些幫助。
    不過對我來說,能夠用淺顯易懂的方式解釋重要的原理,幫助吸收才是最大的好處呢。


    To limonadagurl,
    那個 Bloglines 好像一直怪怪的,還是建議用 Google Reader

    回覆刪除