自動回報 Spam 到 SpamCop
在 Slashdot 看到自動回報的機制:Automate Spamcop Submissions,就想到之前寫的這篇說明文件:SpamCop and SpamCup。
現在想起來,SpamCop 反而是一種 Web 2.0 的模式?因為參與的人愈多,整個架構就愈強大 XD
在 Slashdot 看到自動回報的機制:Automate Spamcop Submissions,就想到之前寫的這篇說明文件:SpamCop and SpamCup。
現在想起來,SpamCop 反而是一種 Web 2.0 的模式?因為參與的人愈多,整個架構就愈強大 XD
遲早會有人把腦筋動到 GPU 強大的運算能力上 :p
這次是利用 Nvidia 的 GPU 弄出一個數學函示庫 GPUFFTW,利用 GPU 計算 FFT 的基本運算加速:High performance FFT on GPUs。
在 Benchmark 中,透過 GPU 加速可以使得 FFT 整體的速度大約是純用 CPU 計算的四倍,但顯示卡的價錢卻只有 CPU 的 1/3。換句話說,把這類運算丟給 GPU 做,讓 CPU 計算其他的事情。
不過還是有些限制:
所以這個 Math Library 實際能應用的領域其實就小很多了…
在 Digg 看到 Google Checkout: PayPal Killer?,原報導在 Welcome to Google Checkout, that will be $3.14 這篇。
文章裡提到了 googlecheckout.{net,org,info} 被 Markmonitor.com 註冊掉 (.com 被其他家公司註冊走了),而這家公司正是註冊 gbrowser.com 的公司,之前替 Google 弄 Whois Protection 的。
而現在這家公司又註冊掉 googlecheckout.*,大家當然會猜測 Google 皆下來會有什麼動作 :p 不過依照 gbrowser.com 的慣例,呃… 其實很多事情還是說不準 :p
WordPress.org 站上的 Search 是透過 Yahoo! Search API 處理,而 Matt 發現這幾天的 Search 功能又爛掉了:Yahoo Search Broken (again?),像是在 Search 頁面找 “mysql” 卻什麼都找不到:
不過文中所提到的 inurl:yahoo.com search 這個 link 在 comments 裡大家都說很正常,可是 Matt 說他透過七台機器試,都不正常… XD
大概是 WordPress.org 用的量太大,API key 被搞不清楚狀況的工程師給 ban 掉了?XD
因為嫌 GIANT LOCK 太多,遠端把在美國的 colo-s4s.hasname.com
從 5.5-PRERELEASE 升級到 6.1-RELEASE,而沒有爛掉要花錢租用 Remote Network KVM 進 single user mode,特別紀念一下。
在 Falling in love with Rojo 看到有人說 Rojo 有改善,就把之前註冊的帳號拿出來測試,發現還是非常不好用。
有很多地方可以用 AJAX 改善的都沒做,造成整個畫面不斷在 refresh,用慣 AJAX Application 後,看起來很痛苦。反倒是沒什麼大改版的 Bloglines 在這點做的就還不錯,相當簡潔,而且沒有廣告…
Nick Bradbury says “Any new Web 2.0 company that hasn’t considered the spam problem automatically isn’t worth my time.” I forget who said it, but my favorite definition of social software is “things that get spammed.”
不知道 Matt 在講什麼…
Social Software 利用 Internet 的 Social Network 產生有用的資訊,再回饋給 Internet。但因為牽扯到「人」,這時候就會有 Spammer 加入,想要透過 Social Network 進行他的廣告。這是 A (social software) => B (spam),不代表 B => A 啊…
有人去用 Google Trends 翻 Google 搜尋關鍵字的排名,發現 “Yahoo” 這個關鍵字比 “porn” 與 “sex” 都高,於是寫了一篇文章 “Google beats porn . . . but not sex.“,而 Digg 的標題下的更好笑 XD Google Users Want Yahoo Even More Than Se x?
搜尋的結果在這:yahoo, sex, porn,我剛剛丟進去找的圖是這樣,藍色是 yahoo,紅色是 sex,橙色是 porn:
在 Google Blogoscoped 看到 Noam Chomsky 也開始利用 Blog 寫一些文章?Noam Chomsky Blog。
實際的 Blog 在這:Noam Chomsky’s blog。
一個團體會需要有個管道和參與的人互動,像是詢問問題、回報問題、提供建議。對於不同的規模,有不同的方法。
在開放原始碼的社群裡面,如果團體很小 (發展者不到三個人),可以透過郵件論壇或是聊天室互相討論。像是 lighttpd 的發展就蠻接近這種模式。
但如果團體比較大,發展者有兩位數甚至三位數,這時候就要有工具幫忙,讓使用者回報問題、提出建議時的紀錄可以有系統的整理出來。這種系統有的時候叫做 Problem Report System,有的時候叫做 Bug Tracking System。像是 Mozilla 在發展軟體所使用的 Bugzilla,或是下面所提到的 GNU GNATS。
我接觸 GNU GNATS 是因為 FreeBSD 使用 GNU GNATS 管理整個專案。
參與 FreeBSD 的發展有幾種方法,一種是擁有 freebsd.org 的帳號,像是 ijliao、leeym、clsung。有時我們叫他們 “committer”,因為這些人可以直接存取 FreeBSD CVS Repository (也就是 “commit”) 以及 GNATS 資料庫。
而另外一種沒有帳號的人,則可以透過 send-pr 將想要改的東西送入 FreeBSD 的 GNATS 資料庫,由 committer 看過以後再 commit 進 CVS Repository,所以我們叫這些人 “submitter”。
我因為參與幾個 FreeBSD ports 的維護工作而玩過 GNU GNATS 的一部份:用 FreeBSD 的 send-pr,將要修改的步驟 (通常就是附上 patch files) 透過 E-mail 送到 FreeBSD 的 GNATS database 裡。送進去後系統會給我一個 PR number。如果有任何 committer 更新這個 PR,我會收到信件通知。
資工系的系計中助教大約有二十個人,這二十個人並不是全部處理同樣的事情。有些人處理 FreeBSD,有些處理 Linux 或 Sun 工作站,有些則處理 Netnews 或是 BBS。我覺得把 PR System 搬進資工系系計中來用,應該可以幫助我們處理一些事情,於是我就在 freshmeat 上看各家 PR System 所使用的情況,以及建構系統的複雜度。
既然這篇不斷的講 GNU GNATS,那當然是因為最後我們用 GNU GNATS。會使用 GNU GNATS 的原因在於運作很簡單:
整個系統的要求極低,不需要 PHP,不需要 MySQL。對於系計中助教而言,在 Unix 上用編輯器修改檔案並不是難事,所以對於助教看起來一切 okay。
但這個年代你不可能叫使用者透過 send-pr 一個一個填,而 GNU GNATS 本身沒有網頁界面,所以必須找個軟體,可以讓使用者透過網頁介面產生 PR,以及查詢目前 PR 處理的進度。
我找到 Gnatsweb 這套軟體,但發現他的介面並不好用,回頭來看 FreeBSD 用哪一套的時候,卻發現 FreeBSD 自己寫了一套給自己的 GNATS Database 用 !@#$%^…
所以我花了一些時間寫了一個網頁介面,可以讓人 Submit & Search,順便練習怎麼寫各家瀏覽器都可以用的 Javascript,然後試著用 Yahoo User Interface Library,學著減少不斷重新造輪子的問題。同時把 RSS 2.0 實做出來:http://help.cs.nctu.edu.tw/pr/。
PS:這篇文章沒有意義,純粹記錄事情而已。
這陣子發現 Spam Karma 擋下來的 Spam 變多了,今天在 Matt 那邊看到 Akismet 的統計資料,跟之前所感覺的差不多,從月中開始爆增:New Spam Stats。統計圖在這:Stats Page (beta)。
在 Digg 看到一張在 National Geographic Society 所刊出的圖:What is so special about this photo?,仔細看才會看出奧妙 XD
ijliao 丟出神秘的 link:PHP5 Benchmark,有一些是等價用法的速度比較,看一看還蠻有趣的… 發現神秘 function,看起來 PHP manual 還不夠熟 o_o
同樣的文章有好幾篇,在那篇文章右邊的 link:PHP4 Benchmark、MySQL Benchmark、Apache Benchmark。
在 Digg 看到最常被拿來當密碼的是 “password” XD:Password Protection is an Oxymoron。
這讓我想起上次系上跑 john 通知使用者改密碼的經驗 XD
在 Google Blogoscoped 看到第一個 PPC Botnet 被發現的消息:Clickbots vs AdSense and Others,不過目前看起來還是蠻傳統的方法控制 (透過 Web servers 抓資料):
The bots are controlled remotely through several Web servers.
理想中的狀態應該是 Botnet 本身是 P2P Network,再透過數位簽章的方式丟指令叫 Botnet 做,使得整個 Botnet 建立後就沒有 single point of failure,而且這樣會大幅提昇 Spammer 的隱密性…
熱鬧滾滾:MS Word Zero-Day Exploit Found。
重點是:(Alert Raised for MS Word Zero-Day Attack)
A zero-day flaw in the ubiquitous Microsoft Word software program is being used in an active exploit by sophisticated hackers in China and Taiwan, according to warnings from anti-virus researchers.
超讚的啦… 看起來是被玩一陣子才被抓到的 XD
在 Digg 看到美國專利局要重審這個惡名昭彰的專利:U.S. Patent Office re-examines Amazon’s ‘One Click’ patent。
重審的原因是 Peter Calveley 發現在 1998 三月就有一個類似的專利,也就是在 One Click 專利的前十八個月。翻了一下他的 Blog,似乎就是為了這件事情成立的,全部都是講 Amazon 專利問題 :p
剛剛看到 DreamHost Blog 的 The Truth About Overselling! 這篇,突然想起有些積了很久的東西要寫 :p
主要有兩個要注意的:
第一個,我們先計算出來:一天有 1440 minutes,如果有兩顆 CPU 就有 2880 CPU minutes,60 CPU mins 佔了 2%+,換句話說,一台雙 CPU 的機器只夠給五十個用滿 2%+ 的客戶用。
第二個,DreamHost 提供了兩種模式跑 PHP:CGI mode (可以跑 PHP4 或 PHP5) 或 mod_php4,前者是預設值,跑 PHP4。
在 CGI mode 下會以 suexec 轉到 user 的身份跑,當然比較安全:所有的檔案權限都可以設定為 600,但是比較慢:因為要先 fork()
再 execl()
到 suexec,再 execl()
到 php.cgi。
而 mod_php4 當然就快多了,少了 fork()
+ execl()
+ execl()
,但 PHP 就是以 apache 的身份在跑,CPU resource 不會掛在 user 帳上,只要不要吃的太兇,其實都不太管。這時 PHP 安全上的問題則是透過 PHP 裡設定 safe_mode,在這個模式下無法透過 fopen()
開啟目錄外的檔案或 symbolic link,以及種種限制。
回過頭來說 Blog Software 以及我對於 Lifetype 開發者心態不以為然。
WordPress 在發展時就都有考慮到 safe_mode 的問題,所以在 DreamHost 上可以直接使用 mod_php4。另外一方面,WordPress 在發展新功能的同時,也在控制 CPU resource 與 MySQL resource 的消耗量。
在 blog.gslin.org 與 gslin.org 還沒搬家前,就是以這種方式在跑。
反過來看當年的 pLog (現在叫 Lifetype),這是 草蝦 2005/06 時裝好 pLog 1.0 後覺得很慢,拿出工具追蹤所發現的紀錄:
03:29 <@Ben_> 救命喔…讀取首頁就要用到 272 個 php 檔案…
到了 2006/02/19,DreamHost Sucks! 我的惡夢! 這篇最後面提到:
PS 2:我的 CPU Minuts 是多少? 195 Minutes 而已啦!他們規定只能用 60 Minutes。
用了整台主機 6%+ 的 CPU resource 還可以大喊人家爛,而且是自己在維護的 Lifetype… *無言*
keso 這篇提到了台灣兩千萬與韓國四千萬的差距:东拉西扯:和徐挺耀聊互联网,實際上… 人數差了一倍,搞起 SNS 以及各種網路的應用本來就有差啊:
但有个问题徐挺耀想不明白,韩国也只有4000多万人口,只是台湾人口的两倍多一点,为什么韩国的互联网产业就完全是另外一个面貌?那里除了大门户网站,还会涌现出OhMyNews和CyWorld这样的让美国人都激动不已的新型社区。所以,过几天他打算去韩国看看。
來講什麼是 mod_rewrite (或是其他類似的東西),以 Group.NCTU.edu.tw 為例,RSS feed 的輸出大致上會長這樣:
http://group.nctu.edu.tw/rss10/darkkiller
我希望把這類的連線要求都交給 rss10.php 處理,變成這樣:
http://group.nctu.edu.tw/rss10.php?g�rkkiller
這就是 mod_rewrite 要做的事情。
那麼用 mod_rewrite 有什麼好處?我可以想到這幾點:
rss10.php
變成 rss10-2.php
) 不會影響到上層的 URL,對於使用者而言不會有感覺。?
與 &
的 URL。像無名的 RSS 與文章 (以彎彎的 Blog 為例) 就做的不太好:
http://www.wretch.cc/blog/cwwany&rss20=1
http://www.wretch.cc/blog/cwwany&article_idU76574
比較好的作法可能是改成這樣:
http://www.wretch.cc/blog/cwwany/rss20
http://www.wretch.cc/blog/cwwany/5576574
甚至改成 feed.wretch.cc
,一開始先用 VirtualHost 跑在同一台上,以後如果發現 RSS 愈來愈吃重,需要以獨立的機器分出來就更方便了。
在 Digg 看到有人被 Dugg 後把 IP address 的資料轉成經緯度資料,用 Google Maps 將所有訪客都標出來:Digg Traffic Plotted On Google Maps (Real-Time)。
像是全世界的流量:
一標出來就知道全世界哪些地方的網路比較發達了 *默*
由於美國政府在 9/11 後愈來愈恐慌,打算在飛機上禁用手機。禁用的原因不是手機影響飛安,而是透過手機,恐怖份子可以很容易的互相溝通。在一個多禮拜前 Bruce Schneier 的 Risks of Cell Phones on Airplanes 這篇文章裡就是在講這件事情。
剛剛看到 Kottke 也對這件事情表示意見,在 Networks on a plane 提到在飛機上使用「網路」的危險性 (不是指「無線網路」干擾飛航,而是指利用「網路」互相聯絡幹壞事,比起手機不受到注意),難道就要因為這樣禁用手提電腦嗎?
Google 因為 Toolbar 的 Suggest 功能「推薦」到非法軟體而被告:Google in Trouble for Suggesting Illegal Software。
Google 說他們不會過濾,因為 “censorship concerns” (咦,那 Google China…),而 Van Laere (被推薦到非法軟體的那家受害公司) 說你們平常就有在 filtering 了,像是 “pornography”、”naked”、”sex”:
In response to the suit, a Google attorney told a Belgian newspaper on Wednesday that they could not filter the results of Google Suggest, citing censorship concerns.
Van Laere said the defense isn’t accurate, since it appears that Google Suggest will not try to complete tracking numbers for shipping items or offer alternate suggestions for sexually-related terms. In a test, Google Suggest did not offer any related words for the terms “pornography,” “naked” and “sex.”
不管怎樣,這件事情要再繼續看看法庭上面怎麼判,這對於 (下一代) 搜尋引擎的影響會很大。
系上有一些軟體是特製的,或是加工過的,因為種種原因無法丟到 FreeBSD ports 裡時,就需要自己搞一個 local ports 之類的東西出來。成果可以參考 opensvn.csie.org/csports/ 這裡。
剛好看到 rafan 的 FreeBSD local ports 這篇講到 local ports 的東西,看起來大家都是去 /usr/share/mk/
下面翻 code 後決定怎麼惡搞,方法都一樣 XD
至於文章裡說 portsdb 很慢,我們是丟到 /etc/daily.local
跑,反正慢慢跑總是跑得完的 :p
PS:rafan 沒注意到 < 與 > 要換成 < 與 >,所以有些 quote 的地方看起來怪怪的。
最近有某個自稱為 Blog 的網站引起討論,剛好看到大胖子 Scoble 說 Blog 要有這五個要素才能叫 Blog:(A blog is not a blog unless…)
結果沒人鳥他 XD
最近寫了一些 Javascript 有關的東西,用 Google 找了一堆資料發現都在 http://www.quirksmode.org/ 裡,但是又不知道這個網站的品質到底好不好,於是就跑去問 hlb 大師…
14:31 <@gslin> hlb_: http://www.quirksmode.org/ 怎樣?用 Google 找了一堆資料發現都在這邊找到 XD
14:33 <@hlb_> gslin: 怎樣喔… 我兩年前就跟你提過這個網站了 :p
14:33 <@gslin> @_@
14:33 * hlb_ 逃
平常都沒在聽大師教誨… (到牆角懺悔)
Blue Security 從四月底開始被 DDoS 攻擊以來不斷的抵抗,直到昨天他們決定放棄:Blue Security Gives up the Fight。
Blue Security 的 Anti-Spam 作法是這樣做:
聽起來很不錯?你沒辦法得到一份有效的列表,但是如果你拿到一個 e-mail address,就用 One-Way Hash Function 算出來,看看在不在這份列表裡面。於是糟糕的事情就來了:如果我是 Spammer,我想要「復原」大部分的 e-mail address,那麼我就拿我手上有的 e-mail address 去計算,再加上用字典檔去試,也許我可以復原一半以上的 e-mail address。
接下來,我寄信給這些 user,告訴他們「這份名單已經外洩,blah blah…」,然後還寄了一大堆 virus/spam/…,於是 Blue Security 就慘了 :p
在 Newscraft 看到的,VeriSign 將以 1.25 億美金現金買下 GeoTrust,坐穩第一名的位置:VeriSign To Buy GeoTrust, Combining Top SSL Providers。
在 Slashdot 看到利用 Social Network 讓借錢這件事情變的更容易:Can Peer-To-Peer Finance Work?。
等下再來更新 (或是開一篇新的寫)。
SpamOrHam.org 是一個建立 Spam 與 Ham (Non-Spam) 樣本的計畫。2005 年時他們拿 TREC 2005 Public Spam Corpus 當作樣本,這份樣本裡的九萬兩千多封信件是以多種 Spam Filtering 軟體判斷歸類出來的,而 SpamOrHam.org 的計畫就是希望以人工的方式審視資料,找出錯誤的判斷。
然而,今天在 Slashdot 上看到網站的發起人認為這個計畫並不成功:People Suck at Spotting Phishing,原文在 There’s one born every minute: spam and phishing。
在文章中他就舉了幾個例子,包括明明看起來只是一個簡單的回信,但使用者卻回報為 Spam。而 Phishing 的信件更糟,Spam Filtering Software 已經正確判斷為 Spam 類,但使用者卻說他不是 Spam…
看起來發起人相當無奈… :P
在 Your Message on Gaxed.com 看到一個 Cache 技巧:
For Gaxed I’m using some heavy caching to prevent it from going down to easily. The basic algorithm is: when a picture is viewed more than 50 times, it’s moving into the cache folder as a static JPG (the page URL will stay the same of course, acting as a permalink). This way, I don’t need to poll the PHP, the database, and I also don’t need to recreate the image using PHP image/ GD.
問題是 counting 要怎麼做比較好?用 memcached 直接做似乎不錯?反正掉了再去抓就好。
在 Tim O’Reilly and defining Web 2.0 這篇看到的,Tim O’Reilly 在 UC Berkeley 演講時這樣定義:
But even more important than their enthusiasm, the users of successful internet applications supply their intelligence. A true Web 2.0 application is one that gets better the more people use it. Google gets smarter every time someone makes a link on the web. Google gets smarter every time someone makes a search. It gets smarter every time someone clicks on an ad. And it immediately acts on that information to improve the experience for everyone else.
It’s for this reason that I argue that the real heart of Web 2.0 is harnessing collective intelligence.
以他的定義,毫無疑問的:
不過這麼說來,Google Maps 就不算 Web 2.0 了?這點倒是跟想像有點出入… 不過不管怎樣,Web 2.0 必須以「人」為中心倒是沒什麼爭議。
Sergey Brin (Google 創辦人、技術部門總裁) 十年前在 Usenet 上寫的東西被自己家的 Google Groups 拿出來鞭 XD:What Sergey Brin Said in 1994/1995。
總共有四篇文章,點 這裡 可以看到,問論文的、問機票的、…。
BitComet 又更新了,看 Changelog 的說明,只是修正一些小 bug,把 ICF/UPnP 支援度加強… 最後看到把 PayPal 那條,這也算 Bugfix 嗎 XD
喝!都快寫完了,結果不知道按到什麼就消失了,再寫一篇。據說寫第二次的時候思路會更清楚,就當作這樣吧。
標題所指的「故意」,是指「故意放反向連結,導入流量使其壯大」。
這篇本來是要回應 M 留言的後半段,後來覺得這篇要寫的東西太多,另外開一篇出來講,這篇就是 M 的留言 後半段:
Roach也認為所謂的類似comment spam的東西錯了,
就到個歉吧就結束了,反正甚麼都有人罵,
而GSL你真的認為智邦是要流量才搞這個的嗎?
是的,我認為智邦網摘師放 Comment Spam 是為了「壯大」(而「流量」只是目的),當然當事人都會否認。而真正的答案除非找 Snape 對 Roach & amarylliss 施破心術,不然大概是沒有機會知道了。Uma 的留言 講得更清楚明白了:
> 想問的是,
> 智邦初期的通知與其是要通知作者,
> 但背後真的沒有要潛藏向作者的讀者廣告智邦友邦大家摘錄好文讀服務呢?依他們那群人厚臉皮的程度,我相信他們會告訴你「沒有」…
另外,當事人完全沒有打算要認錯啊,他們仍然認為他們做的不是 Comment Spam。
再加上 Roach 的回答完全依照「網路論文撰寫技巧」而寫,看不出討論的誠意在哪裡,像是 Roach 這篇 [網路] : 父子騎驢,怎麼吃都癢的網摘事業 一開始以一個故事開頭:
有個故事大家一定聽過,有一對父子騎驢進城,一開始,爸爸讓小孩騎驢。路人A說:「這小孩怎麼這樣,讓爸爸走路!」於是換爸爸騎驢,路人B又說,「這爸爸怎麼這樣,小孩年紀這麼小,讓他走路!」於是兩人一起騎驢,路人C又說:「這家人怎麼這樣虐待動物!」於是兩人下來走路,路人D又說:「這家人真是笨蛋,好好的驢不騎!」最後怎樣?父子決定把驢殺來吃掉比較乾脆。
這個故事告訴我們「人不能沒有主見,應該自我思考」,而 Roach 卻接到:
最近這網摘事業也遇到這樣的問題了。一下說,你摘我的東西要尊重我,要徵求我的同意。也有人說,他認為的網路禮儀是摘完後要告知,但不用等到同意,若有意見再撤掉。最近又一股聲音出來了,說網摘原本就是資訊自由,你愛摘就摘,但摘完不要通知我,否則就是spam!
好吧,這才真的叫做,你不可能討好這世界上所有的人。
剛好符合 網路論文撰寫技巧 的:
而 amarylliss 根本不認為他所做的是 Comment Spam:(2006/03/01 的文章,2006/04/04 的留言,Spam 這篇)
這叫做「網摘」並不是SPAM
@�
以及 2006/05/13,amarylliss 的留言:(後半部)
總之,你通知不通知,都會有人在旁邊有意見。
有意見是好的,不過到底怎麼做才是最符合眾多網友的期待,而且顧及所有BLOGGER的情緒,這是智邦生活館必須思考的。
沒有人道歉啊?更何況還說:(amarylliss,最後面一句)
但是您個人的想法,我個人認為不代表大多數人對網摘的看法…
在這篇文章之前,所有的討論文章都環繞在 三個錯誤的論點 上面跑,而導致有些清醒的人跳出來為智邦的網摘師辯護,所以這些網摘師被群眾給沖昏頭,以為有很多人支持網摘師到 Comment 上「通知原作者」是正確的:
真正的錯誤在 Spam、Spam、Spam,這是道德問題,不是法律問題。我可以很明白的告訴你,是我們幾個人在 irc 上幹剿後,由 hlb 第一個提出完整「Comment Spam」的論點 (網摘(阿爸生我,不是要我來討戰的)),之後把問題移到這個很嚴重的道德問題上。
如我前面所說,沒有人知道真相,沒有人會知道是不是故意的。但就前面我所敘述的言論,我不相信 Roach 與智邦的網摘師。
1994 年 老人家 的文章 (那時候還不老),現在 2006 年了,但還是很值得看:
發信人: ltc@news.cc.nctu (center liu), 信區: Network 標 題: 網路"論文"撰寫技巧(初級) 發信站: National Chiao Tung University, Taiwan (Thu Sep 1 10:13:17 1994) 轉信站: Maxwell!bbsroute!news.csie.nctu!news.cc.nctu!news!ltc 網路"論文"撰寫技巧(初級) ●斷章取義:一般為文不易達成目的,在電腦上於己有利的才放 在同一頁上。充分利用電腦每頁24行之特性。 ●視而不見:一般為文會被人恥笑,BBS、NEWS 的 PAGER 做的 都不好,於己不利的片斷正好利用這一套。 ●嘩眾取寵:REPLY 少的沒人看。 ●觸犯眾怒:生氣的人破綻多,才有利可乘。 ●標題要驚人:標題不驚人,內容沒人看。 ●一答一唱:一人演多角,才有戲劇效果。 ●合理夾帶無理:辯論賽上會扣分的技巧非用不可,論文撰寫 可沒人打分數。 ●拉攏次要敵人,打擊主要敵人。 ●說人不敢說,打擊權威,群眾最愛廖添丁。 交通大學計算機中心 劉大川
趁著機器在升級的時候再寫一篇。先補充一下,我之前的文章提到的陳豐偉先生就是 Roach。
看來文章寫太長就會失焦,在 網摘的禮貌跟Spam 這篇文章裡面根本誤解我的意思,這跟「禮貌」沒關係,跟「金錢」也沒關係 (雖然很多人對此不滿),真正的重點是 「通知」這件事情本來就不應該做!
我的意思是:
所以我會說:
最後,有人叫我在家裡擦神燈看看,趕快出來放話吧~
Slashdot 看到 phk 與 D-Link 達成共識,現有的 D-Link 產品有權利使用 phk 在丹麥機房放的 NTP server,但未來出貨的產品將不會使用:D-Link Settles Danish Time Dispute。
phk 正式的公告在這:people.freebsd.org/~phk/dlink/。
另外 The Register 也說明了完整的處理方法,除了 phk 在丹麥的 NTP server 外,D-Link 將聯絡全球受影響的 NTP server 進行補救:(D-Link settles dispute with ‘time geek’)
D-Link is freeloading onto as many as 50 NTP time servers, critics claim. The US military, NASA and government groups worldwide are reportedly running NTP servers interrogated by D-Link kit.
這件事雖然影響很大,但事後的補救的結果讓大家都還算滿意… 暫時告一段落。
事情的始末可以參考我之前寫的 NTP 與 DNS 以及 richliu 寫的 DLink 產品的DDOS攻擊行為.。
Slashdot 看到的消息:ICANN Finally Rejects .xxx Domain (被歸在政治類新聞,因為美國政府的干涉),ICANN 正式的公告在這:ICANN Board Votes Against .XXX Sponsored Top Level Domain Agreement。
其實有蠻多人期待成立 .xxx 網域,主要是有幾個原因:
結果 .xxx 網域最後沒有成立… The Register 的報導說的好:(ICANN chokes off .xxx porn registry)
The reality is that ICANN has again been compromised by political pressures - pressures that both sides claim not to exist.
Slashdot 這篇 12.8 Petabytes, You Say? 提到可以利用「灌水」(應該還有很多特殊的技術要用上去) 將硬碟的容量提高到 “12-13 PB per cubic centimeter” (每立方公分 12.8 PB)。我記得現在有在做的 (有生產線的) 3.5 吋硬碟裡,最大應該是單顆 750GB?
這麼大的硬碟,不知道未來會有什麼應用催生出來 :P (Google 那種不算…)
Netcraft 報導了這個月的 Web Server 的佔有率改變的現象:May 2006 Web Server Survey。
關於 Godaddy 惡搞的前情題要部分請參考 ijliao 這篇 OpenSourceParking,有比較完整的說明。簡單來說就是 Godaddy 把所有 Hosting 都從 Apache 換成 Windows 2003 Server,造成 Netcraft 上統計出來的� ��字大地震,造成 Apache 佔有率下滑 5.7%。
而這個月,Netcraft 修正了 Redirect 的問題,使得本來會被認為 “Other” 的 Web Server 能夠正確判斷出來,使得 Apache 又回升 2%:
This month 1.7 million hostnames at Go Daddy that were classified as “Other” in April are recognized as Apache sites running on Linux. Large blocks of Apache sites at Go Daddy have shifted back and forth between Apache and Other since January , due to changes in its bulk hosting service. It uses a front-end system that generates an HTTP redirect with no Server header when a site is first accessed - only once the redirect is followed, or if the site is accessed a second time, does it identify Apache as the server.
The latest shift helps Apache regain 2% market share after a drop of 5.7% last month, when Go Daddy shifted more than 4 million hostnames from Apache to Windows Server 2003. Apache’s improvement this month has no effect on Go Daddy’s continued hosting of parked domains on Windows Server 2003, which gains 143K hostnames at Go Daddy this month.
剛剛 Dedicated Hosting 連外網路似乎怪怪的,這點可以在 smokeping.hasname.com 上面發現:
不過同時間我發現從 TANet 連外的 MSN 也斷了,而且 smokeping.hasname.com 上偵測學校的部分:
可以看出來線路還是怪怪的,我猜測 是因為北美某個重要節點出問題,各 ISP 調整 routing 避開,而 TANet 動作最慢。(聽起來蠻合理的?)
FreeBSD ports 的 PHP 一直都有一個很嚴重的問題:沒有辦法生出同時支援 FastCGI 與 apache module 的 PHP 版本。
這個問題終於在前幾天解決了:
20060506:
AFFECTS: users of PHP
AUTHOR: ale@FreeBSD.orgThe old PHP slave ports (phpN-cli, phpN-cgi and mod_phpN) were removed in favour of unified PHP ports that allow building any combination of PHP SAPIs (cli, cgi and apache module). The PHP CGI binary was renamed to php-cgi, so you should update the path in your script. To simplify the update process, *only* for this release a ‘php’ compatibility symlink to php-cgi will be created if you don’t select the CLI SAPI. Before the upgrade you *should* run ‘make config’ in lang/php4 or lang/php5 to configure the SAPIs you want to install. As a consequence the default binary packages include the CLI and the FastCGI SAPIs.
先用 make config
重新設定,再用 portupgrade -f
更新,這樣應該沒什麼大問題…。
一年前有個傢伙弄了一個站台,有無限多的頁面 (每個頁面都有一些 link 連到其他頁面),打算研究 Search Engine Bot 的行為,他弄完以後就把消息丟出來,讓一些 PageRank 高的站台 link 過去 (這樣 Search Engine 才會努力抓?),不過後來大家都忘記了 XD
一年過去了,剛剛在 Digg 看到他把結果分析出來了:Search bots behavior analyzed。包括了 Google bot、Yahoo bot、MSN bot:On Bots。
如果你不喜歡看敘述的話,圖很漂亮,可以去看看 XD
當 BlueSecurity 遭受 DDoS 攻擊後,他們的解法是把 www.bluesecurity.com 指到 bluesecurity.blogs.com (TypePad):DDoS on Blue Security Blog Knocks Typepad, LiveJournal Offline。
在 Digg 看到的:Simple Optimization for PHP and MySQL,原文在 Simple Optimization for PHP and MySQL 這裡,其實都是一些習慣問題積少成多。
MySQL 的部分在 O’Reilly 的 High Performance MySQL 裡都有講到。PHP 的部分有些是經驗,倒是可以看一看…
有些朋友問我們 (blog.ijliao.info、hlb.yichi.org、blog.gslin.org、…) 到底搬到哪裡,也想要從 DreamHost 換出來,不過前陣子不想回,所以只有在 ijliao 那邊的 comment 有提到:Server4Sale。
Server4Sale 是 Reseller,幫好幾家做,在網路上的評價還不錯。我們這次買到 Layered Technologies 的 server 目前用起來也很愉快,拿到機器時是 FreeBSD 5.4-RELEASE,過沒幾天就升級到 5.5-PRERELEASE,而且裝了五百個 packages… (被 ijliao 看到後就被罵 XD)
速度方面可以看 smokeping:smokeping.hasname.com,本來 HiNet 過去大約要 220ms,這幾天也降到 180ms 左右:
技術服務方面倒是很迅速,像是送 Ticket 要求 Reset,很快就會被轉到 Data Center,大約一個小時內會搞定。
不過其他的部分就怪怪的 XD 像這三天發生一件鳥事情:我們覺得 Server4Sale 不錯,想要續約,所以星期二就送了一個 Ticket 問看看有沒有年繳的 discount,過了幾分鐘,線上值班的客服就回「我們會轉給 billing 部門請他們回答」,結果今天星期五了,還沒有答案 o_O
喂喂… 這樣的話我乾脆跳到 Layered Technologies 算了…
Slashdot:U.S. Considers Anti-Satellite Laser。(NYTimes:Administration Researches Laser Weapon)
把對方的衛星打下來?打歐盟的 GPS 衛星吧 :p
在 shakalaca 那邊看到 SkypeSMS 的消息:Skype 2.5 beta。看了費率,發現台灣的簡訊是全世界最低的?SMS rates to all destinations。