禁止了 ini_set() 的指令
而台灣蘋果網站一些頁面的抓取需要設定 user agent
所以今日修改程式
由原來的
ini_set('user_agent', 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.0.3705; .NET CLR 1.1.4322)');
改為 cURL 的指令
curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Maxthon; Maxthon; .NET CLR 1.1.4322; .NET CLR 2.0.50727)');
.
never4get兄。爲什麽今天的報紙雜志都只剩一張圖片了。
回覆刪除never4get大大
回覆刪除請問新版的台灣蘋果和壹週刊要去哪download啊?
PDA4X和腦友記廣場都找不到
可以告訴我們去哪download嗎?
@suntes
回覆刪除謝謝告知
問題已修正
portablewebap 已經裝了 curl 模組
回覆刪除可以照這樣更改嗎?
我置換掉 ini_set 那一行為
curl_setopt 那一行
執行後出現
Warning: curl_setopt(): supplied argument is not a valid cURL handle resource in D:\PortableWeb\Program\www\localhost\next\twnext.php on line 4
還是這不適用 portablewebap?
謝謝。
謝謝!
回覆刪除@eafy
回覆刪除最近台灣壹周刊需要登入帳號密碼才能抓取內容,
所以目前暫時不打算分享 php 源碼。
@匿名
回覆刪除要改的不只一行
以抓取 $baseurl 這網頁為例
---------------------------------------------
$ch = curl_init();
curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Maxthon; Maxthon; .NET CLR 1.1.4322; .NET CLR 2.0.50727)');
curl_setopt($ch,CURLOPT_URL,$baseurl);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
@$front = curl_exec($ch);
curl_close($ch);
----------------------------------------------
我的是 11/23 版。
回覆刪除這一期我發現文章整個空白 (@twnext_view.php)
後來發現似乎是 .cfm 那個 url 變了
要加上 /next/ 才對
請問這是跟目前最新版相比唯一不同的地方嗎?
(因為我加入此路徑後就可以看了)
新的 user-agent 我也試了
可以用
只是上面那六航要放在 twnext.php 中間一點的地方才可以
放在原來最上面的 ini_set 那邊好像沒法子用
謝謝。
版大,
回覆刪除PDA4X似乎掛掉了屢連不上,還好有你的部落格,看到有網友討論壹週刊,就順著修改也能用了。順便放在免費空間..
壹週刊393期QVGA版→http://rapidshare.de/files/41061444/twnext393.pdb.html
壹週刊393期Web版→http://rapidshare.de/files/41061448/twnext_393_web.rar.html
12月4日臺灣四大報→http://rapidshare.de/files/41058147/1204.rar.html
壹週刊393期大圖版→http://rapidshare.de/files/41061683/twnext393b.pdb.html
回覆刪除@匿名,never4get,各位高人
回覆刪除你好,我的twnext_view.php 依你方法加上/next/ 開啟後依然是空白一片,但如果我用原網址 ( http://1-apple.com.tw/next/dsp_PrintArt.cfm?NewsType=twnext&IssueID=394&Art_ID=31214928 )看的話就可看到內容,真的百思不解????????
網誌管理員已經移除這則留言。
回覆刪除網誌管理員已經移除這則留言。
回覆刪除冒昧地問一下,你製作的那些台灣壹週刊在網上還有網盤存檔嗎?舊的xun6已經上不去了。
回覆刪除謝謝:)