標簽的語言粒度
![](http://image.woshipm.com/wp-files/img/41.jpg)
一年零六個月前,我寫了篇使用標簽是遲早的事來反駁“就博客而言,標簽沒有太大意義”的觀點。最近又看到在分享里有篇文章提到tags在中文網(wǎng)站用不好的原因之一是語言的粒度問題,因為“英文的粒度是單詞,中文的粒度是字?!辈⑶遗e了個“貓”的例子,英文tags多半是cat,而中文tags可能是貓、貓貓、貓咪、咪咪、小貓咪等等。
我認為這個結論還是不夠準確,問題任何語言都存在,只是各有各的表現(xiàn)特征。在某種程度上,中文可能表現(xiàn)的很麻煩,但英文也簡單不到哪里去,比如英文的復數(shù)?!跺\繡藍圖》中有個關于英文正餐之前開胃菜說法的例子,可以叫starter, first course, appetizer, Hors d’oeuvres, Anamuse-gueule,另外西餐館可能叫grazing,運動主題酒吧可能叫warmups。
可見,問題的關鍵是計算機不能像人一樣主動思考。并且現(xiàn)實生活中,因為語言、文化、習慣、專業(yè)等等因素,很容易造成詞匯混亂。在信息架構專業(yè)領域里,有個方法叫“創(chuàng)建受控詞匯表”。顧名思義,就是統(tǒng)一“約定俗成的表意詞”,用人工的關系組織來讓計算機明白N種說法其實都一樣。
文章提到第二個用戶習慣的原因,我認為確實客觀存在。但這個不是“中文”的問題,用戶也可以再教育,比如很多做的好的英文產(chǎn)品上,也能看到中文用戶提供并維護很好的tags體系。當然,說到網(wǎng)民容易把話題扯很大,反正現(xiàn)實是目前絕大多數(shù)中文網(wǎng)民上網(wǎng)的首要任務還不是“任務導向”。
綜上所述,我認為問題的根本不在tag本身,而是設計層面做的不夠。在實際的處理方案中,我認為tags不一定需要用戶來提供,因為確實價值有限。但如果是團隊內(nèi)部用tags來組織信息,肯定會收到事半功倍的效果。只不過中英文的處理上,應該需要注意中文本地化問題。
還是關于“語言粒度”的例子,英文tags的input錄入控件里,約定成俗的習慣基本都用英文逗號“,”做分隔符,而很多中文網(wǎng)站也延續(xù)了這個規(guī)范。我認為并不合適,因為英文的粒度是單詞,有可能用多個單詞加空格來做描述;而中文的粒度是文字,所有詞描述都由N個字組成。另外,中英文切換也不方便,所以中文tags的input錄入控件用“空格”做分隔符最合適。
源地址:http://blog.rexsong.com/?p=10005
感謝博主分享