2008年12月1日 星期一

台灣蘋果壹周刊程式修改

最近一些免費空間(如 http://www.000webhost.com/ )為了安全的理由
禁止了 ini_set() 的指令
而台灣蘋果網站一些頁面的抓取需要設定 user agent
所以今日修改程式
由原來的

ini_set('user_agent', 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.0.3705; .NET CLR 1.1.4322)');


改為 cURL 的指令

curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Maxthon; Maxthon; .NET CLR 1.1.4322; .NET CLR 2.0.50727)');


.

14 則留言:

  1. never4get兄。爲什麽今天的報紙雜志都只剩一張圖片了。

    回覆刪除
  2. never4get大大

    請問新版的台灣蘋果和壹週刊要去哪download啊?

    PDA4X和腦友記廣場都找不到

    可以告訴我們去哪download嗎?

    回覆刪除
  3. @suntes
    謝謝告知
    問題已修正

    回覆刪除
  4. portablewebap 已經裝了 curl 模組
    可以照這樣更改嗎?

    我置換掉 ini_set 那一行為
    curl_setopt 那一行

    執行後出現
    Warning: curl_setopt(): supplied argument is not a valid cURL handle resource in D:\PortableWeb\Program\www\localhost\next\twnext.php on line 4

    還是這不適用 portablewebap?

    謝謝。

    回覆刪除
  5. @eafy
    最近台灣壹周刊需要登入帳號密碼才能抓取內容,
    所以目前暫時不打算分享 php 源碼。

    回覆刪除
  6. @匿名

    要改的不只一行
    以抓取 $baseurl 這網頁為例
    ---------------------------------------------
    $ch = curl_init();
    curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Maxthon; Maxthon; .NET CLR 1.1.4322; .NET CLR 2.0.50727)');
    curl_setopt($ch,CURLOPT_URL,$baseurl);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
    @$front = curl_exec($ch);
    curl_close($ch);
    ----------------------------------------------

    回覆刪除
  7. 我的是 11/23 版。
    這一期我發現文章整個空白 (@twnext_view.php)
    後來發現似乎是 .cfm 那個 url 變了
    要加上 /next/ 才對
    請問這是跟目前最新版相比唯一不同的地方嗎?
    (因為我加入此路徑後就可以看了)

    新的 user-agent 我也試了
    可以用
    只是上面那六航要放在 twnext.php 中間一點的地方才可以
    放在原來最上面的 ini_set 那邊好像沒法子用

    謝謝。

    回覆刪除
  8. 版大,

    PDA4X似乎掛掉了屢連不上,還好有你的部落格,看到有網友討論壹週刊,就順著修改也能用了。順便放在免費空間..

    壹週刊393期QVGA版→http://rapidshare.de/files/41061444/twnext393.pdb.html

    壹週刊393期Web版→http://rapidshare.de/files/41061448/twnext_393_web.rar.html

    12月4日臺灣四大報→http://rapidshare.de/files/41058147/1204.rar.html

    回覆刪除
  9. 壹週刊393期大圖版→http://rapidshare.de/files/41061683/twnext393b.pdb.html

    回覆刪除
  10. @匿名,never4get,各位高人

    你好,我的twnext_view.php 依你方法加上/next/ 開啟後依然是空白一片,但如果我用原網址 ( http://1-apple.com.tw/next/dsp_PrintArt.cfm?NewsType=twnext&IssueID=394&Art_ID=31214928 )看的話就可看到內容,真的百思不解????????

    回覆刪除
  11. 網誌管理員已經移除這則留言。

    回覆刪除
  12. 網誌管理員已經移除這則留言。

    回覆刪除
  13. 冒昧地問一下,你製作的那些台灣壹週刊在網上還有網盤存檔嗎?舊的xun6已經上不去了。
    謝謝:)

    回覆刪除