防止被惡意網站用「框架技術」偷文章的技術教學(Break Out of a Frame)

最近工具人在幫鷹眼觀察網檢查 SEO 品質時,突然發現我們網站的內容除了一些被全文複製偷走的外,還有一些新創公司(例如:7Headlines)更是光明正大地把整個網站直接「打包帶走」。

這些新創公司利用既有的框架程式技術(Frame),將許多創作者嘔心瀝血的文章直接包在它們自己的網站框架中,依靠他人網站知名度來替自己的網站賺取流量,這種疑似偷竊的行為早已被許多網站主給罵到臭頭。

打包別人網站文章的技術在國外已行之有年,甚至有個專有名詞用來稱呼這類網站,叫做:「Scraper」,翻譯成中文就是鏟土機或是刮刀的意思,名稱取得頗有詩意,不過在國外的創作者之間依然是被視為極其惡劣的行為。這些 Scraper 實質上除了破壞他人網站布局的美感、不具備任何生產力等糟糕特點外,甚至利用他人網站的頻寬流量來達到獲利的目的,但是網站的流量本身在許多伺服器供應商中,都是需要支付使用費的,等同變相網站主跟部落客要支付費用給這些盜取內容的網站

荒不荒謬?

另外,新創公司私自將他人網站內容植入自家網頁,再運用網路 SEO 技術讓自己在搜尋引擎佔有高排名,等於使用者在不曉得前因後果的情況下,將有極大可能被誘導入 Scraper 網站,而非原創者的網站。

因此,無論是盜用流量或是借用內容等行為在我們看來已經觸法,而且很明顯都是與創作者產生利益衝突的爭點所在。

幸好,前面曾提到這項技術在國外已經行之有年,因此反制技術理所當然也已經被設計出來,英文稱作「Break Out of a Frame」。我們下面提供二種方法可以達到跳轉出來的目的。

方法一:下載 BreakOutFrame.php 檔案(點擊下載),存放在你自己網站空間的根目錄下,再將下面程式碼貼在網頁中 <head> 與 </head> 之間即可(如下圖一):

<?php include_once("breakoutframe.php"); ?>

這個方法可以讓網頁在不影響原有速度下新增跳轉服務。

Break-Out-Of-A-Frame-Scraper

圖一,Break Out Command in HTML.

方法二:將下面這段程式碼複製貼進網頁的 <head> 與 </head> 之間,也可以達到與方法一相同的目的,但是有可能延緩網頁的載入速度:

<script>if (top.location != location ) {top.location.href = location.href;}</script>

無論大家採用哪一種方法,只要網路使用者進入 Scraper 網站,顯示我們的網頁內容時就會觸發跳轉程式,如此一來就能將使用者的網頁瀏覽器重新導回我們的真實網站。

不過工具人必須承認,這樣做雖然解決了 Scraper 帶來的問題,但從廣義的角度來看,還是已經消耗到「我們」的網站流量(至少是正常網站被開啟一次的 1.5 倍以上),並讓網站運作速度被拖慢(多了一個無用的判斷式),這實在是秀才遇到兵,有理也講不清下的無奈解決辦法。

  •  
  •  
  •  
  •  
  •  
  •  

說些什麼吧

您也許也會喜歡…