找回密碼 或 安全提問
 註冊
|註冊|登錄

伊莉討論區

搜索
尊貴會員無限下載附件儲值後自動升級用戶組認識好友、聊天,分享生活趣事

休閒聊天興趣交流學術文化旅遊交流飲食交流家庭事務PC GAMETV GAME
熱門線上其他線上感情感性寵物交流家族門派動漫交流貼圖分享BL/GL
音樂世界影視娛樂女性頻道潮流資訊BT下載區GB下載區下載分享短片
電腦資訊數碼產品手機交流交易廣場網站事務長篇小說體育運動時事經濟
上班一族博彩娛樂

[繁]魔王陛下,RETRY

太色了

[繁]再見龍生,你好人

[繁]香格里拉・開拓異

[繁]孤單一人的異世界

[繁]亂马½ 11-
C & C++ 語言C# 語言Visual Basic 語言PHP 語言JAVA 語言
查看: 6125|回復: 3
打印上一主題下一主題

[問題]PHP爬蟲抓中油95油價,出現中文亂碼[複製鏈接]

Rank: 1

帖子
128
積分
98 點
潛水值
3586 米
跳轉到指定樓層
樓主
發表於 2020-10-23 05:49 PM|只看該作者|倒序瀏覽
分享使你變得更實在,可以使其他人感到快樂,分享是我們的動力。今天就來分享你的資訊、圖片或檔案吧。
本帖最後由 u48326 於 2020-10-23 05:54 PM 編輯

欲由中油官網得知當日的95油價,用PHP 的 getElementById() 做法,但 id 含有中文、結果回傳值為空。
第2行測試一個無中文的 id,有抓到值,但回傳時中文顯示亂碼。
查中油首頁設定 charset=utf-8,所以我在爬蟲程式裡也加入:
header("Content-Type:text/html; charset=utf-8");卻無效果。程式如附件。有請前輩指導,謝謝!
...
瀏覽完整內容,請先 註冊登入會員
附件: 你需要登錄才可以下載或查看附件。沒有帳號?註冊
分享分享0收藏收藏0支持支持0

使用道具檢舉

Rank: 6Rank: 6Rank: 6Rank: 6Rank: 6Rank: 6

帖子
155
積分
1282 點
潛水值
48025 米
頭香
發表於 2020-10-25 03:01 AM|只看該作者
成為伊莉的版主,你將獲得更高級和無限的權限。把你感興趣的版面一步步地發展和豐盛,那種滿足感等著你來嚐嚐喔。
你的文件有存成unicode嗎?也許這樣可以解決你的問題

使用道具檢舉

Rank: 1

帖子
128
積分
98 點
潛水值
3586 米
3
發表於 2020-10-26 03:28 PM|只看該作者
如果發覺自己無法使用一些功能或出現問題,請按重新整理一次,並待所有網頁內容完全載入後5秒才進行操作。
tryit244178 發表於 2020-10-25 03:01 AM
下載: 訪客無法瀏覽下載點,請先 註冊登入會員

你的文件有存成unicode嗎?也許這樣可以解決你的問題

程式是用 Notepad++ 編輯,預設儲存是 UTF-8 。
若在第6行增加一行:echo $html;
...
瀏覽完整內容,請先 註冊登入會員

使用道具檢舉

Rank: 1

帖子
128
積分
98 點
潛水值
3586 米
4
發表於 2020-10-26 04:06 PM|只看該作者
所有積分大於負-100的壞孩子,將可獲得重新機會成為懲罰生,權限跟幼兒生一樣。
本帖最後由 u48326 於 2020-10-26 04:09 PM 編輯

搞定了。
原來 UTF-8 的網頁在 loadHTML() 之前要加一道小手續:

$searchPage = mb_convert_encoding($html, 'HTML-ENTITIES', "UTF-8");

原程式修改後如附件。
附件: 你需要登錄才可以下載或查看附件。沒有帳號?註冊

使用道具檢舉

您需要登錄後才可以回帖 登錄 | 註冊

Powered by Discuz!

© Comsenz Inc.

重要聲明:本討論區是以即時上載留言的方式運作,對所有留言的真實性、完整性及立場等,不負任何法律責任。而一切留言之言論只代表留言者個人意見,並非本網站之立場,用戶不應信賴內容,並應自行判斷內容之真實性。於有關情形下,用戶應尋求專業意見(如涉及醫療、法律或投資等問題)。 由於本討論區受到「即時上載留言」運作方式所規限,故不能完全監察所有留言,若讀者發現有留言出現問題,請聯絡我們。有權刪除任何留言及拒絕任何人士上載留言,同時亦有不刪除留言的權利。切勿上傳和撰寫 侵犯版權(未經授權)、粗言穢語、誹謗、渲染色情暴力或人身攻擊的言論,敬請自律。本網站保留一切法律權利。
回頂部