Gea-Suan Lin's BLOG

Tuesday, May 30, 2006

自動回報 Spam 到 SpamCop

看到自動回報的機制:Automate Spamcop Submissions,就想到之前寫的這篇說明文件:SpamCop and SpamCup

現在想起來, 反而是一種 Web 2.0 的模式?因為參與的人愈多,整個架構就愈強大 XD

用 GPU 跑 FFT

遲早會有人把腦筋動到 GPU 強大的運算能力上 :p

這次是利用 的 GPU 弄出一個數學函示庫 ,利用 GPU 計算 FFT 的基本運算加速:High performance FFT on GPUs

在 Benchmark 中,透過 GPU 加速可以使得 FFT 整體的速度大約是純用 CPU 計算的四倍,但顯示卡的價錢卻只有 CPU 的 1/3。換句話說,把這類運算丟給 GPU 做,讓 CPU 計算其他的事情。

不過還是有些限制:

  • 只有 32-bits (single-precision) float point 可以用,這是 GPU 所造成的限制,如果以後有 GPU 支援 64-bits 才有辦法支援上去。
  • 只能跑 1-D FFT。
  • 在科學計算上面還要考慮到「正確性」的問題:GPU 計算時可能會有誤差,在畫圖的時候差一些沒關係,但科學計算的時候是不被允許的…

所以這個 Math Library 實際能應用的領域其實就小很多了…

試用 Opera 9.0 Beta

因為 Desktop 的速度不快,換用 試看看。雖然說過了 ,但非主流 Browser 對於中文的美化程度還是有差啊 :p 而且有些操作介面的親和性還是不太夠… (繼續觀望)

Monday, May 29, 2006

Google Checkout

看到 Google Checkout: PayPal Killer?,原報導在 Welcome to Google Checkout, that will be $3.14 這篇。

文章裡提到了 googlecheckout.{net,org,info} 被 註冊掉 (.com 被其他家公司註冊走了),而這家公司正是註冊 gbrowser.com 的公司,之前替 弄 Whois Protection 的。

而現在這家公司又註冊掉 googlecheckout.*,大家當然會猜測 皆下來會有什麼動作 :p 不過依照 gbrowser.com 的慣例,呃… 其實很多事情還是說不準 :p

Sunday, May 28, 2006

WordPress.org 站上的 Search 又爛了…

站上的 Search 是透過 API 處理,而 發現這幾天的 Search 功能又爛掉了:Yahoo Search Broken (again?),像是在 Search 頁面找 “mysql” 卻什麼都找不到:

WordPress Search

不過文中所提到的 inurl:yahoo.com search 這個 link 在 comments 裡大家都說很正常,可是 說他透過七台機器試,都不正常… XD

大概是 用的量太大,API key 被搞不清楚狀況的工程師給 ban 掉了?XD

Google Error

不常遇到 Error 的 502 錯誤頁面持續超過一分鐘:

Google Error Page

Saturday, May 27, 2006

升級到 6.1-RELEASE

因為嫌 GIANT LOCK 太多,遠端把在美國的 colo-s4s.hasname.com 從 5.5-PRERELEASE 升級到 6.1-RELEASE,而沒有爛掉要花錢租用 Remote Network KVM 進 single user mode,特別紀念一下。

Thursday, May 25, 2006

再用一次 Rojo

Falling in love with Rojo 看到有人說 有改善,就把之前註冊的帳號拿出來測試,發現還是非常不好用。

有很多地方可以用 AJAX 改善的都沒做,造成整個畫面不斷在 refresh,用慣 AJAX Application 後,看起來很痛苦。反倒是沒什麼大改版的 在這點做的就還不錯,相當簡潔,而且沒有廣告…

Social Software

在這篇這樣講:(Web2 Spam)

Nick Bradbury says “Any new Web 2.0 company that hasn’t considered the spam problem automatically isn’t worth my time.” I forget who said it, but my favorite definition of social software is “things that get spammed.”

不知道 在講什麼…

Social Software 利用 Internet 的 Social Network 產生有用的資訊,再回饋給 Internet。但因為牽扯到「人」,這時候就會有 Spammer 加入,想要透過 Social Network 進行他的廣告。這是 A (social software) => B (spam),不代表 B => A 啊…

Google 搜尋關鍵字列表

有人去用 搜尋關鍵字的排名,發現 “Yahoo” 這個關鍵字比 “porn” 與 “sex” 都高,於是寫了一篇文章 “Google beats porn . . . but not sex.“,而 的標題下的更好笑 XD Google Users Want Yahoo Even More Than Se x?

搜尋的結果在這:yahoo, sex, porn,我剛剛丟進去找的圖是這樣,藍色是 yahoo,紅色是 sex,橙色是 porn:

yahoo, sex, porn

Noam Chomsky

看到 也開始利用 Blog 寫一些文章?Noam Chomsky Blog

實際的 Blog 在這:

Wednesday, May 24, 2006

Problem Report System

一個團體會需要有個管道和參與的人互動,像是詢問問題、回報問題、提供建議。對於不同的規模,有不同的方法。

在開放原始碼的社群裡面,如果團體很小 (發展者不到三個人),可以透過郵件論壇或是聊天室互相討論。像是 的發展就蠻接近這種模式。

但如果團體比較大,發展者有兩位數甚至三位數,這時候就要有工具幫忙,讓使用者回報問題、提出建議時的紀錄可以有系統的整理出來。這種系統有的時候叫做 Problem Report System,有的時候叫做 Bug Tracking System。像是 在發展軟體所使用的 ,或是下面所提到的

我接觸 是因為 使用 管理整個專案。

參與 的發展有幾種方法,一種是擁有 freebsd.org 的帳號,像是 。有時我們叫他們 “committer”,因為這些人可以直接存取 CVS Repository (也就是 “commit”) 以及 GNATS 資料庫。

而另外一種沒有帳號的人,則可以透過 send-pr 將想要改的東西送入 的 GNATS 資料庫,由 committer 看過以後再 commit 進 CVS Repository,所以我們叫這些人 “submitter”。

我因為參與幾個 的維護工作而玩過 的一部份:用 的 send-pr,將要修改的步驟 (通常就是附上 patch files) 透過 E-mail 送到 的 GNATS database 裡。送進去後系統會給我一個 PR number。如果有任何 committer 更新這個 PR,我會收到信件通知。

資工系的系計中助教大約有二十個人,這二十個人並不是全部處理同樣的事情。有些人處理 ,有些處理 工作站,有些則處理 Netnews 或是 BBS。我覺得把 PR System 搬進資工系系計中來用,應該可以幫助我們處理一些事情,於是我就在 上看各家 PR System 所使用的情況,以及建構系統的複雜度。

既然這篇不斷的講 ,那當然是因為最後我們用 。會使用 的原因在於運作很簡單:

  • 透過 send-pr 產生 PR。事實上 send-pr 只是產生一個範本,然後呼叫編輯器 (、…) 讓你填寫欄位,最後以 E-mail 送到 GNATS Database 裡。
  • 透過 edit-pr 修改 PR。事實上 edit-pr 會產生一個檔案,然後呼叫編輯器,你修改完欄位以後他會檢查哪些欄位被修改了,再修改 GNATS Database。

整個系統的要求極低,不需要 ,不需要 。對於系計中助教而言,在 Unix 上用編輯器修改檔案並不是難事,所以對於助教看起來一切 okay。

但這個年代你不可能叫使用者透過 send-pr 一個一個填,而 本身沒有網頁界面,所以必須找個軟體,可以讓使用者透過網頁介面產生 PR,以及查詢目前 PR 處理的進度。

我找到 這套軟體,但發現他的介面並不好用,回頭來看 用哪一套的時候,卻發現 自己寫了一套給自己的 GNATS Database 用 !@#$%^…

所以我花了一些時間寫了一個網頁介面,可以讓人 Submit & Search,順便練習怎麼寫各家瀏覽器都可以用的 Javascript,然後試著用 ,學著減少不斷重新造輪子的問題。同時把 實做出來:http://help.cs.nctu.edu.tw/pr/

PS:這篇文章沒有意義,純粹記錄事情而已。

Tuesday, May 23, 2006

Blog Spam

這陣子發現 擋下來的 Spam 變多了,今天在 那邊看到 的統計資料,跟之前所感覺的差不多,從月中開始爆增:New Spam Stats。統計圖在這:Stats Page (beta)

Monday, May 22, 2006

一張有趣的圖

看到一張在 National Geographic Society 所刊出的圖:What is so special about this photo?,仔細看才會看出奧妙 XD

Tringo

在他的 Blog 上提到的 Flash 遊戲,很簡單的遊戲,可是還蠻好玩的:Tringo

PHP4/5 的效率分析

丟出神秘的 link:PHP5 Benchmark,有一些是等價用法的速度比較,看一看還蠻有趣的… 發現神秘 function,看起來 PHP manual 還不夠熟 o_o

同樣的文章有好幾篇,在那篇文章右邊的 link:PHP4 BenchmarkMySQL BenchmarkApache Benchmark

最常被拿來當密碼的…

看到最常被拿來當密碼的是 “password” XD:Password Protection is an Oxymoron

這讓我想起上次系上跑 john 通知使用者改密碼的經驗 XD

Sunday, May 21, 2006

PPC (Pay Per Click) Botnet

看到第一個 PPC Botnet 被發現的消息:Clickbots vs AdSense and Others,不過目前看起來還是蠻傳統的方法控制 (透過 Web servers 抓資料):

The bots are controlled remotely through several Web servers.

理想中的狀態應該是 Botnet 本身是 P2P Network,再透過數位簽章的方式丟指令叫 Botnet 做,使得整個 Botnet 建立後就沒有 single point of failure,而且這樣會大幅提昇 Spammer 的隱密性…

Saturday, May 20, 2006

Microsoft Word Zero-Day Exploit

熱鬧滾滾:MS Word Zero-Day Exploit Found

重點是:(Alert Raised for MS Word Zero-Day Attack)

A zero-day flaw in the ubiquitous Microsoft Word software program is being used in an active exploit by sophisticated hackers in China and Taiwan, according to warnings from anti-virus researchers.

超讚的啦… 看起來是被玩一陣子才被抓到的 XD

“One Click” 專利

看到美國專利局要重審這個惡名昭彰的專利:U.S. Patent Office re-examines Amazon’s ‘One Click’ patent

重審的原因是 發現在 1998 三月就有一個類似的專利,也就是在 One Click 專利的前十八個月。翻了一下他的 Blog,似乎就是為了這件事情成立的,全部都是講 專利問題 :p

DreamHost 的 CPU 限制

剛剛看到 The Truth About Overselling! 這篇,突然想起有些積了很久的東西要寫 :p

主要有兩個要注意的:

第一個,我們先計算出來:一天有 1440 minutes,如果有兩顆 CPU 就有 2880 CPU minutes,60 CPU mins 佔了 2%+,換句話說,一台雙 CPU 的機器只夠給五十個用滿 2%+ 的客戶用。

第二個, 提供了兩種模式跑 :CGI mode (可以跑 PHP4 或 PHP5) 或 mod_php4,前者是預設值,跑 PHP4。

在 CGI mode 下會以 suexec 轉到 user 的身份跑,當然比較安全:所有的檔案權限都可以設定為 600,但是比較慢:因為要先 fork()execl() 到 suexec,再 execl() 到 php.cgi。

而 mod_php4 當然就快多了,少了 fork() + execl() + execl(),但 就是以 apache 的身份在跑,CPU resource 不會掛在 user 帳上,只要不要吃的太兇,其實都不太管。這時 安全上的問題則是透過 裡設定 safe_mode,在這個模式下無法透過 fopen() 開啟目錄外的檔案或 symbolic link,以及種種限制。

回過頭來說 Blog Software 以及我對於 開發者心態不以為然。

在發展時就都有考慮到 safe_mode 的問題,所以在 上可以直接使用 mod_php4。另外一方面, 在發展新功能的同時,也在控制 CPU resource 與 resource 的消耗量。

還沒搬家前,就是以這種方式在跑。

反過來看當年的 pLog (現在叫 ),這是 2005/06 時裝好 pLog 1.0 後覺得很慢,拿出工具追蹤所發現的紀錄:

03:29 <@Ben_> 救命喔…讀取首頁就要用到 272 個 php 檔案…

到了 2006/02/19,DreamHost Sucks! 我的惡夢! 這篇最後面提到:

PS 2:我的 CPU Minuts 是多少? 195 Minutes 而已啦!他們規定只能用 60 Minutes。

用了整台主機 6%+ 的 CPU resource 還可以大喊人家爛,而且是自己在維護的 … *無言*

Friday, May 19, 2006

SNS 以及各種網路的應用

這篇提到了台灣兩千萬與韓國四千萬的差距:东拉西扯:和徐挺耀聊互联网,實際上… 人數差了一倍,搞起 SNS 以及各種網路的應用本來就有差啊:

但有个问题徐挺耀想不明白,韩国也只有4000多万人口,只是台湾人口的两倍多一点,为什么韩国的互联网产业就完全是另外一个面貌?那里除了大门户网站,还会涌现出OhMyNews和CyWorld这样的让美国人都激动不已的新型社区。所以,过几天他打算去韩国看看。

為什麼要使用 mod_rewrite?

來講什麼是 mod_rewrite (或是其他類似的東西),以 為例,RSS feed 的輸出大致上會長這樣:

http://group.nctu.edu.tw/rss10/darkkiller

我希望把這類的連線要求都交給 rss10.php 處理,變成這樣:

http://group.nctu.edu.tw/rss10.php?g�rkkiller

這就是 mod_rewrite 要做的事情。

那麼用 mod_rewrite 有什麼好處?我可以想到這幾點:

  • 服務的穩定性:對於發展中的平台而言,mod_rewrite 提供了彈性,使得底層的改變 (譬如 rss10.php 變成 rss10-2.php) 不會影響到上層的 URL,對於使用者而言不會有感覺。
  • SEO:Search Engine 會比較偏好沒有 ?& 的 URL。

像無名的 RSS 與文章 (以彎彎的 Blog 為例) 就做的不太好:

  • http://www.wretch.cc/blog/cwwany&rss20=1
  • http://www.wretch.cc/blog/cwwany&article_idU76574

比較好的作法可能是改成這樣:

  • http://www.wretch.cc/blog/cwwany/rss20
  • http://www.wretch.cc/blog/cwwany/5576574

甚至改成 feed.wretch.cc,一開始先用 VirtualHost 跑在同一台上,以後如果發現 RSS 愈來愈吃重,需要以獨立的機器分出來就更方便了。

將 Digg 流量結合 Google Maps

看到有人被 Dugg 後把 IP address 的資料轉成經緯度資料,用 將所有訪客都標出來:Digg Traffic Plotted On Google Maps (Real-Time)

像是全世界的流量:

一標出來就知道全世界哪些地方的網路比較發達了 *默*

在飛機上的手機

由於美國政府在 9/11 後愈來愈恐慌,打算在飛機上禁用手機。禁用的原因不是手機影響飛安,而是透過手機,恐怖份子可以很容易的互相溝通。在一個多禮拜前 Risks of Cell Phones on Airplanes 這篇文章裡就是在講這件事情。

剛剛看到 也對這件事情表示意見,在 Networks on a plane 提到在飛機上使用「網路」的危險性 (不是指「無線網路」干擾飛航,而是指利用「網路」互相聯絡幹壞事,比起手機不受到注意),難道就要因為這樣禁用手提電腦嗎?

Google Toolbar 的「推薦」功能出包

因為 Toolbar 的 Suggest 功能「推薦」到非法軟體而被告:Google in Trouble for Suggesting Illegal Software

說他們不會過濾,因為 “censorship concerns” (咦,那 Google China…),而 Van Laere (被推薦到非法軟體的那家受害公司) 說你們平常就有在 filtering 了,像是 “pornography”、”naked”、”sex”:

In response to the suit, a Google attorney told a Belgian newspaper on Wednesday that they could not filter the results of Google Suggest, citing censorship concerns.

Van Laere said the defense isn’t accurate, since it appears that Google Suggest will not try to complete tracking numbers for shipping items or offer alternate suggestions for sexually-related terms. In a test, Google Suggest did not offer any related words for the terms “pornography,” “naked” and “sex.”

愈來愈像 了…

不管怎樣,這件事情要再繼續看看法庭上面怎麼判,這對於 (下一代) 搜尋引擎的影響會很大。

FreeBSD 的 local ports

系上有一些軟體是特製的,或是加工過的,因為種種原因無法丟到 FreeBSD ports 裡時,就需要自己搞一個 local ports 之類的東西出來。成果可以參考 這裡。

剛好看到 FreeBSD local ports 這篇講到 local ports 的東西,看起來大家都是去 /usr/share/mk/ 下面翻 code 後決定怎麼惡搞,方法都一樣 XD

至於文章裡說 portsdb 很慢,我們是丟到 /etc/daily.local 跑,反正慢慢跑總是跑得完的 :p

PS: 沒注意到 < 與 > 要換成 &lt; 與 &gt;,所以有些 quote 的地方看起來怪怪的。

Thursday, May 18, 2006

Slashdot 上沒有 Comment 的文章?

透過 第二次看到沒有 Comment 的文章:Spacecraft Crashes Into Satellite

晚點再來看一次。

Blog 是什麼?

最近有某個自稱為 Blog 的網站引起討論,剛好看到大胖子 說 Blog 要有這五個要素才能叫 Blog:(A blog is not a blog unless…)

  • Ease of publishing.
  • Discoverability. (Pings weblogs.com or technorati or another ping server).
  • Conversationality. (Trackbacks or as-they-happen referer logs, or now being part of Technorati and other blog search engines).
  • Linkability. (All posts should have permalinks).
  • Syndicatability. (All content should be available in RSS feeds).

結果沒人鳥他 XD

純打屁聊天…

最近寫了一些 Javascript 有關的東西,用 找了一堆資料發現都在 裡,但是又不知道這個網站的品質到底好不好,於是就跑去問

14:31 <@gslin> hlb_: 怎樣?用 找了一堆資料發現都在這邊找到 XD
14:33 <@hlb_> gslin: 怎樣喔… 我兩年前就跟你提過這個網站了 :p
14:33 <@gslin> @_@
14:33 * hlb_ 逃

平常都沒在聽大師教誨… (到牆角懺悔)

Blue Security 放棄

從四月底開始被 DDoS 攻擊以來不斷的抵抗,直到昨天他們決定放棄:Blue Security Gives up the Fight

的 Anti-Spam 作法是這樣做:

  1. 先成立一個網站,讓大家登記他們的 e-mail address,告訴全世界「不要 spam 這些信箱」。
  2. 這些 e-mail address 是以 One-Way Hash Function 計算後的資料型態公開出來。

聽起來很不錯?你沒辦法得到一份有效的列表,但是如果你拿到一個 e-mail address,就用 One-Way Hash Function 算出來,看看在不在這份列表裡面。於是糟糕的事情就來了:如果我是 Spammer,我想要「復原」大部分的 e-mail address,那麼我就拿我手上有的 e-mail address 去計算,再加上用字典檔去試,也許我可以復原一半以上的 e-mail address。

接下來,我寄信給這些 user,告訴他們「這份名單已經外洩,blah blah…」,然後還寄了一大堆 virus/spam/…,於是 就慘了 :p

VeriSign 買下 GeoTrust

看到的, 將以 1.25 億美金現金買下 ,坐穩第一名的位置:VeriSign To Buy GeoTrust, Combining Top SSL Providers

Wednesday, May 17, 2006

透過 Social Network 借錢?

看到利用 Social Network 讓借錢這件事情變的更容易:Can Peer-To-Peer Finance Work?

等下再來更新 (或是開一篇新的寫)。

不知道在搞什麼鬼…

早上睡醒就看到 這篇報導:黑白 MacBook 登場 MacBook Pro 順道升級,當時看到關於電池的部份是:

就順便把上面這張圖丟上 ,等到查清楚資料再丟上

結果吃個早餐,弄一弄,打開 發現文章有變動:

看起來有人在看 reverse link… (我發現 有把 的那頁收進去)

放上 favicon.ico

一樣把 favicon.ico 放上去了,如果看不到的話,清 cache 應該就可以看到了 :P

Tuesday, May 16, 2006

人對於 Spam 的判斷能力

是一個建立 Spam 與 Ham (Non-Spam) 樣本的計畫。2005 年時他們拿 當作樣本,這份樣本裡的九萬兩千多封信件是以多種 Spam Filtering 軟體判斷歸類出來的,而 的計畫就是希望以人工的方式審視資料,找出錯誤的判斷。

然而,今天在 上看到網站的發起人認為這個計畫並不成功:People Suck at Spotting Phishing,原文在 There’s one born every minute: spam and phishing

在文章中他就舉了幾個例子,包括明明看起來只是一個簡單的回信,但使用者卻回報為 Spam。而 Phishing 的信件更糟,Spam Filtering Software 已經正確判斷為 Spam 類,但使用者卻說他不是 Spam…

看起來發起人相當無奈… :P

Your Message on Gaxed.com 看到一個 Cache 技巧:

For Gaxed I’m using some heavy caching to prevent it from going down to easily. The basic algorithm is: when a picture is viewed more than 50 times, it’s moving into the cache folder as a static JPG (the page URL will stay the same of course, acting as a permalink). This way, I don’t need to poll the PHP, the database, and I also don’t need to recreate the image using PHP image/ GD.

問題是 counting 要怎麼做比較好?用 直接做似乎不錯?反正掉了再去抓就好。

Monday, May 15, 2006

Web 2.0 的定義

Tim O’Reilly and defining Web 2.0 這篇看到的,Tim O’Reilly 在 演講時這樣定義:

But even more important than their enthusiasm, the users of successful internet applications supply their intelligence. A true Web 2.0 application is one that gets better the more people use it. Google gets smarter every time someone makes a link on the web. Google gets smarter every time someone makes a search. It gets smarter every time someone clicks on an ad. And it immediately acts on that information to improve the experience for everyone else.

It’s for this reason that I argue that the real heart of Web 2.0 is harnessing collective intelligence.

以他的定義,毫無疑問的:

  • 當用的人愈來愈多,網站就愈來愈豐富的 這類 Social Bookmark 當然是 Web 2.0。
  • 當然也是 Web 2.0,前者以群眾力量產生文章,後者則是以群眾力量發表評論。(不要忘記, 真正的重點都在 comments 裡 XD)

不過這麼說來, 就不算 Web 2.0 了?這點倒是跟想像有點出入… 不過不管怎樣,Web 2.0 必須以「人」為中心倒是沒什麼爭議。

Sergey Brin 1994-1995 在 Usenet

( 創辦人、技術部門總裁) 十年前在 Usenet 上寫的東西被自己家的 拿出來鞭 XD:What Sergey Brin Said in 1994/1995

總共有四篇文章,點 這裡 可以看到,問論文的、問機票的、…。

BitComet 0.67

又更新了,看 Changelog 的說明,只是修正一些小 bug,把 ICF/UPnP 支援度加強… 最後看到把 那條,這也算 Bugfix 嗎 XD

  • GUI Bugfix: fix the incorrect prompt text when open torren file failed
  • GUI Bugfix: change PayPal picture auto-update period to one day
  • GUI Bugfix: improve the detecting algorithm of Real file decoder in Video Codec Check Wizard
  • Core Improved: enhanced ICF/UPNP port mapping operation
  • Core Bugfix: fix the bug that the program may crash when received incorrect packet

Sunday, May 14, 2006

關於「智邦」與「智邦網摘師」是不是故意的事情

喝!都快寫完了,結果不知道按到什麼就消失了,再寫一篇。據說寫第二次的時候思路會更清楚,就當作這樣吧。

標題所指的「故意」,是指「故意放反向連結,導入流量使其壯大」。

這篇本來是要回應 M 留言的後半段,後來覺得這篇要寫的東西太多,另外開一篇出來講,這篇就是 M 的留言 後半段:

Roach也認為所謂的類似comment spam的東西錯了,
就到個歉吧就結束了,反正甚麼都有人罵,
而GSL你真的認為智邦是要流量才搞這個的嗎?

是的,我認為智邦網摘師放 Comment Spam 是為了「壯大」(而「流量」只是目的),當然當事人都會否認。而真正的答案除非找 對 Roach & amarylliss 施破心術,不然大概是沒有機會知道了。Uma 的留言 講得更清楚明白了:

> 想問的是,
> 智邦初期的通知與其是要通知作者,
> 但背後真的沒有要潛藏向作者的讀者廣告智邦友邦大家摘錄好文讀服務呢?

依他們那群人厚臉皮的程度,我相信他們會告訴你「沒有」…

另外,當事人完全沒有打算要認錯啊,他們仍然認為他們做的不是 Comment Spam。

再加上 Roach 的回答完全依照「網路論文撰寫技巧」而寫,看不出討論的誠意在哪裡,像是 Roach 這篇 [網路] : 父子騎驢,怎麼吃都癢的網摘事業 一開始以一個故事開頭:

有個故事大家一定聽過,有一對父子騎驢進城,一開始,爸爸讓小孩騎驢。路人A說:「這小孩怎麼這樣,讓爸爸走路!」於是換爸爸騎驢,路人B又說,「這爸爸怎麼這樣,小孩年紀這麼小,讓他走路!」於是兩人一起騎驢,路人C又說:「這家人怎麼這樣虐待動物!」於是兩人下來走路,路人D又說:「這家人真是笨蛋,好好的驢不騎!」最後怎樣?父子決定把驢殺來吃掉比較乾脆。

這個故事告訴我們「人不能沒有主見,應該自我思考」,而 Roach 卻接到:

最近這網摘事業也遇到這樣的問題了。一下說,你摘我的東西要尊重我,要徵求我的同意。也有人說,他認為的網路禮儀是摘完後要告知,但不用等到同意,若有意見再撤掉。最近又一股聲音出來了,說網摘原本就是資訊自由,你愛摘就摘,但摘完不要通知我,否則就是spam!

好吧,這才真的叫做,你不可能討好這世界上所有的人。

剛好符合 網路論文撰寫技巧 的:

  • 合理夾帶無理:辯論賽上會扣分的技巧非用不可,論文撰寫可沒人打分數。

而 amarylliss 根本不認為他所做的是 Comment Spam:(2006/03/01 的文章,2006/04/04 的留言,Spam 這篇)

這叫做「網摘」並不是SPAM
@�

以及 2006/05/13,amarylliss 的留言:(後半部)

總之,你通知不通知,都會有人在旁邊有意見。
有意見是好的,不過到底怎麼做才是最符合眾多網友的期待,而且顧及所有BLOGGER的情緒,這是智邦生活館必須思考的。

沒有人道歉啊?更何況還說:(amarylliss,最後面一句)

但是您個人的想法,我個人認為不代表大多數人對網摘的看法…

在這篇文章之前,所有的討論文章都環繞在 三個錯誤的論點 上面跑,而導致有些清醒的人跳出來為智邦的網摘師辯護,所以這些網摘師被群眾給沖昏頭,以為有很多人支持網摘師到 Comment 上「通知原作者」是正確的:

  1. 法律上:Link 是有問題的:十年前的問題在五年前就已經消失了。現在 Link 是合法的,而且 Link 會帶動資訊的交換。
  2. 法律上:商業用途違背某些人的 CC 授權:Link 不受 CC 影響,「引用」才受影響。
  3. 道德上:為什麼摘的人拿錢,寫的人沒錢?:「分類」這件事情本來就有人力成本,就如同 最早是用人力維護 Category/Directory。

真正的錯誤在 Spam、Spam、Spam,這是道德問題,不是法律問題。我可以很明白的告訴你,是我們幾個人在 irc 上幹剿後,由 第一個提出完整「Comment Spam」的論點 (網摘(阿爸生我,不是要我來討戰的)),之後把問題移到這個很嚴重的道德問題上。

如我前面所說,沒有人知道真相,沒有人會知道是不是故意的。但就前面我所敘述的言論,我不相信 Roach 與智邦的網摘師。

Saturday, May 13, 2006

[tw.bbs.comp.network] 網路”論文”撰寫技巧(初級)

1994 年 的文章 (那時候還不老),現在 2006 年了,但還是很值得看:

 發信人: ltc@news.cc.nctu (center liu), 信區: Network 標  題: 網路"論文"撰寫技巧(初級) 發信站: National Chiao Tung University, Taiwan (Thu Sep  1 10:13:17 1994) 轉信站: Maxwell!bbsroute!news.csie.nctu!news.cc.nctu!news!ltc          網路"論文"撰寫技巧(初級)  ●斷章取義:一般為文不易達成目的,在電腦上於己有利的才放       在同一頁上。充分利用電腦每頁24行之特性。  ●視而不見:一般為文會被人恥笑,BBS、NEWS 的 PAGER 做的             都不好,於己不利的片斷正好利用這一套。  ●嘩眾取寵:REPLY 少的沒人看。  ●觸犯眾怒:生氣的人破綻多,才有利可乘。  ●標題要驚人:標題不驚人,內容沒人看。  ●一答一唱:一人演多角,才有戲劇效果。  ●合理夾帶無理:辯論賽上會扣分的技巧非用不可,論文撰寫         可沒人打分數。  ●拉攏次要敵人,打擊主要敵人。  ●說人不敢說,打擊權威,群眾最愛廖添丁。      交通大學計算機中心        劉大川 

智邦網摘師的行為 Spam - 再說明

趁著機器在升級的時候再寫一篇。先補充一下,我之前的文章提到的陳豐偉先生就是 Roach。

看來文章寫太長就會失焦,在 網摘的禮貌跟Spam 這篇文章裡面根本誤解我的意思,這跟「禮貌」沒關係,跟「金錢」也沒關係 (雖然很多人對此不滿),真正的重點是 「通知」這件事情本來就不應該做!

我的意思是:

  1. Bookmark 這件事情本來就不應該通知原站台 沒做、 也沒做。Link 這件事情也不應該通知原站台 沒做, 沒做, 沒做, 也沒做。做這種事情是要反向� �原作者的平台帶入流量進入 Myshare,這是 Spam Behavior
  2. 雖然不應該做,但一般人的網摘會因為 自動化」的 Pingback 而產生反向連結,重點在「自動化」而不是「故意」,所以知道運作的人通常不會在意。 的 Pingback 樣子通常是長得像下面這張圖,其中上半部是 Comment,下半部就是 Pingback:
  3. 而智邦的「網摘師」完全不理會這件事情,用「手動」留言大量 Spam。
  4. 最後,智邦的 Roach 根本不願意承認錯誤,另外還以「著作權法」、「公平交易法」混淆 Spam 這件事情。

所以我會說:

  • 智邦是故意放任網摘師在 Blog 上留 Comment,進而反向導入流量,以「Bookmark」之名行「Spam」之實,帶動網站的流量,將 MyShare 壯大。

最後,有人叫我在家裡擦神燈看看,趕快出來放話吧~

Google Maps 與 traceroute 結合

看到的:Traceroute.V - an HTML traceroute with Google Maps

需要 Java,我沒裝,所以我只能看看 Screenshot :p

Friday, May 12, 2006

台灣藝術大學的網頁

的網頁編碼用簡體中文 GB2312?

D-Link NTP 事件暫時平息

看到 達成共識,現有的 產品有權利使用 在丹麥機房放的 NTP server,但未來出貨的產品將不會使用:D-Link Settles Danish Time Dispute

正式的公告在這:people.freebsd.org/~phk/dlink/

另外 也說明了完整的處理方法,除了 在丹麥的 NTP server 外, 將聯絡全球受影響的 NTP server 進行補救:(D-Link settles dispute with ‘time geek’)

D-Link is freeloading onto as many as 50 NTP time servers, critics claim. The US military, NASA and government groups worldwide are reportedly running NTP servers interrogated by D-Link kit.

這件事雖然影響很大,但事後的補救的結果讓大家都還算滿意… 暫時告一段落。

事情的始末可以參考我之前寫的 NTP 與 DNS 以及 寫的 DLink 產品的DDOS攻擊行為.

Slashdot CSS Redesign

看到 的 CSS Redesign 資訊,點進去看發現兩件事情:

  • 這年頭都沒人想用 Serif 當內文嗎?看起來很吃力耶 =_=
  • 自用這麼小要死喔 =_=

這是 原來的 Screenshot:

這兩張是參賽的作品:

三張圖的字都已經放大過一次 (在 裡按 Ctrl-+),後面這兩張還是小小一個字,!@#$%^…

ICANN 否決 .xxx 網域

看到的消息:ICANN Finally Rejects .xxx Domain (被歸在政治類新聞,因為美國政府的干涉), 正式的公告在這:ICANN Board Votes Against .XXX Sponsored Top Level Domain Agreement

其實有蠻多人期待成立 .xxx 網域,主要是有幾個原因:

  • 如果成立了,政府可以利用法律的力量強制 當地的 色情網站業者必須使用 .xxx 網域,而 K-12 的單位 (在台灣就是高中以下的學校) 就可以擋 .xxx。
  • 或許你會說「網路無國界」,跑到沒有立法的地方設立 .com 的網站就好。但你忽略了一件事情:頻寬的成本以及色情網站連線品質的考量。
    色情網站很耗費頻寬,尤其是 Video 以及 Streaming 的部分,後者要求網路的品質更高。目前全球的網路的中心在北美,品質最好的點也在北美,色情網站如果要設立,機器通常都會放在北美,而必須服從當地法律。
    這個方法不能做到 100% 防制,但這個方法如果有效實施,可以用很低的社會成本控制色情網站,這也就是為什麼上一條裡「當地的」會加重語氣。

結果 .xxx 網域最後沒有成立… 的報導說的好:(ICANN chokes off .xxx porn registry)

The reality is that ICANN has again been compromised by political pressures - pressures that both sides claim not to exist.

高密度硬碟?

這篇 12.8 Petabytes, You Say? 提到可以利用「灌水」(應該還有很多特殊的技術要用上去) 將硬碟的容量提高到 “12-13 PB per cubic centimeter” (每立方公分 12.8 PB)。我記得現在有在做的 (有生產線的) 3.5 吋硬碟裡,最大應該是單顆 750GB?

這麼大的硬碟,不知道未來會有什麼應用催生出來 :P ( 那種不算…)

Tuesday, May 09, 2006

Windows Live Messenger 安裝畫面

那邊看到的:Windows Live Messenger

這是怎樣 XD

Web Server 佔有率

報導了這個月的 Web Server 的佔有率改變的現象:May 2006 Web Server Survey

關於 惡搞的前情題要部分請參考 這篇 OpenSourceParking,有比較完整的說明。簡單來說就是 把所有 Hosting 都從 換成 Windows 2003 Server,造成 上統計出來的� ��字大地震,造成 佔有率下滑 5.7%。

而這個月, 修正了 Redirect 的問題,使得本來會被認為 “Other” 的 Web Server 能夠正確判斷出來,使得 又回升 2%:

This month 1.7 million hostnames at Go Daddy that were classified as “Other” in April are recognized as Apache sites running on Linux. Large blocks of Apache sites at Go Daddy have shifted back and forth between Apache and Other since January , due to changes in its bulk hosting service. It uses a front-end system that generates an HTTP redirect with no Server header when a site is first accessed - only once the redirect is followed, or if the site is accessed a second time, does it identify Apache as the server.

The latest shift helps Apache regain 2% market share after a drop of 5.7% last month, when Go Daddy shifted more than 4 million hostnames from Apache to Windows Server 2003. Apache’s improvement this month has no effect on Go Daddy’s continued hosting of parked domains on Windows Server 2003, which gains 143K hostnames at Go Daddy this month.

不過這樣寫看不太懂啊,到底 還有多少 在跑?以及 的 Policy…

斷線

剛剛 Dedicated Hosting 連外網路似乎怪怪的,這點可以在 上面發現:

不過同時間我發現從 TANet 連外的 MSN 也斷了,而且 上偵測學校的部分:

可以看出來線路還是怪怪的,我猜測 是因為北美某個重要節點出問題,各 ISP 調整 routing 避開,而 TANet 動作最慢。(聽起來蠻合理的?)

FreeBSD 下的 PHP

的 PHP 一直都有一個很嚴重的問題:沒有辦法生出同時支援 與 apache module 的 PHP 版本。

這個問題終於在前幾天解決了:

20060506:
AFFECTS: users of PHP
AUTHOR: ale@FreeBSD.org

The old PHP slave ports (phpN-cli, phpN-cgi and mod_phpN) were removed in favour of unified PHP ports that allow building any combination of PHP SAPIs (cli, cgi and apache module). The PHP CGI binary was renamed to php-cgi, so you should update the path in your script. To simplify the update process, *only* for this release a ‘php’ compatibility symlink to php-cgi will be created if you don’t select the CLI SAPI. Before the upgrade you *should* run ‘make config’ in lang/php4 or lang/php5 to configure the SAPIs you want to install. As a consequence the default binary packages include the CLI and the FastCGI SAPIs.

先用 make config 重新設定,再用 portupgrade -f 更新,這樣應該沒什麼大問題…。

Search Engine Bot 分析

一年前有個傢伙弄了一個站台,有無限多的頁面 (每個頁面都有一些 link 連到其他頁面),打算研究 Search Engine Bot 的行為,他弄完以後就把消息丟出來,讓一些 PageRank 高的站台 link 過去 (這樣 Search Engine 才會努力抓?),不過後來大家都忘記了 XD

一年過去了,剛剛在 看到他把結果分析出來了:Search bots behavior analyzed。包括了 Google bot、Yahoo bot、MSN bot:On Bots

如果你不喜歡看敘述的話,圖很漂亮,可以去看看 XD

BlueSecurity 會不會太搞笑…

遭受 DDoS 攻擊後,他們的解法是把 指到 ():DDoS on Blue Security Blog Knocks Typepad, LiveJournal Offline

Saturday, May 06, 2006

一些改進 PHP 與 MySQL 效率的技巧

看到的:Simple Optimization for PHP and MySQL,原文在 Simple Optimization for PHP and MySQL 這裡,其實都是一些習慣問題積少成多。

的部分在 裡都有講到。 的部分有些是經驗,倒是可以看一看…

Friday, May 05, 2006

Yahoo! Kimo 的字典

剛剛發現 的字典有 AJAX?不知道是什麼時候加上去的,以前沒發現…

Hosting…

有些朋友問我們 (blog.ijliao.info、hlb.yichi.org、blog.gslin.org、…) 到底搬到哪裡,也想要從 換出來,不過前陣子不想回,所以只有在 那邊的 comment 有提到:

是 Reseller,幫好幾家做,在網路上的評價還不錯。我們這次買到 的 server 目前用起來也很愉快,拿到機器時是 5.4-RELEASE,過沒幾天就升級到 5.5-PRERELEASE,而且裝了五百個 packages… (被 看到後就被罵 XD)

速度方面可以看 smokeping:,本來 過去大約要 220ms,這幾天也降到 180ms 左右:

技術服務方面倒是很迅速,像是送 Ticket 要求 Reset,很快就會被轉到 Data Center,大約一個小時內會搞定。

不過其他的部分就怪怪的 XD 像這三天發生一件鳥事情:我們覺得 不錯,想要續約,所以星期二就送了一個 Ticket 問看看有沒有年繳的 discount,過了幾分鐘,線上值班的客服就回「我們會轉給 billing 部門請他們回答」,結果今天星期五了,還沒有答案 o_O

喂喂… 這樣的話我乾脆跳到 算了…

用 Yahoo! 搜尋「陳有蘭溪」

據說搜尋「陳有蘭溪」會出現這個:(小圖可能不清楚,點進去看原大小的圖比較清楚)

雷射砲

U.S. Considers Anti-Satellite Laser。(Administration Researches Laser Weapon)

把對方的衛星打下來?打歐盟的 GPS 衛星吧 :p

Thursday, May 04, 2006

SkypeSMS

那邊看到 SkypeSMS 的消息:Skype 2.5 beta。看了費率,發現台灣的簡訊是全世界最低的?SMS rates to all destinations