Trong bài viết này obatambeienwasirherbal.com sẽ reviews mang đến các bạn một thư viện khôn xiết thông dụng, sẽ là thư viện PHP. Simple HTML DOM Parser. Tlỗi viện này giúp bạn có thể mang được tổng thể dữ liệu có vào trang Web nhưng bạn có nhu cầu đem dữ liệu. Cùng obatambeienwasirherbal.com tìm hiểu nhé.
Bạn đang xem: Lấy dữ liệu từ website khác bằng php
Hiểu dễ dàng và đơn giản PHPhường. Simple HTML DOM Parser là 1 trong những thư viện tất cả công dụng đó là tríchxuất câu chữ HTMLtừ 1 trang làm sao đó hoặc một quãng HTML do vày bạn từ cung cấp, nó hỗ trợ một vài tài năng như:
Hỗ trợ bóc tách bóc tài liệu theo từng id, class, hoặc thẻ img, a, table, p...
Code nđính thêm, dễ dàng học, dễ dàng viết, dễ dàng ghi nhớ.
Khá vơi tuy vậy cũng tương đối bổ ích.Để mua về thỏng viện này bạn cũng có thể phải Home của nó ở khu vực sauhttp://simplehtmldom.sourceforge.netđể down về.
Sau khi đã tất cả thư viện các bạn copy file simple_html_dom.phpvào dự án của bản thân cùng includenó vào file bạn muốn đem tài liệu để hoàn toàn có thể áp dụng.
Tiếp theo chúng ta cùng điểm qua một số trong những ví dụ về câu hỏi mang dự liệu với thư viện này nhé.
Để gọi ngôn từ một tệp tin ta dùng nhỏng sau.
$html = file_get_html("https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpglinks yêu cầu lấy"https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg);emang lại $html;Bây giờ bạn cũng có thể chạy thửgiúp xem công dụng. Rất đơn giản dễ dàng bắt buộc ko làm sao chỉ cần một dòng code là bạn đã có thể echo ra toàn cục câu chữ HTML của mộttrang web rồi. Và chúng ta thuộc mày mò tiếp về kiểu cách bóc tách tách bóc dữ liệu bằng thỏng viện này rồi nhé nhé.
Hiển thị toàn bộ những ảnhtừ trang phải đem sang trọng website mình.
Xem thêm: file_exists trong php
$html = file_get_html("https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpghttp://www.google.com/"https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg);foreach($html->find("https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpgimg"https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg) as $element) emang đến "https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg
Hiển thị toàn bộ những link trong bài viết.
foreach($html->find("https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpga"https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg) as $element) emang lại $element->href . "https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg"https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg;Lấy văn bản xuất phát từ 1 id cố gắng thể.
$noidung = $html->find("https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg#ten_id"https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg,0);Ở đoạn code nàygồm cyếu số 0 vì chưng trong html find đã trả về tài liệu dạng mảng nếu như khách hàng không truyền 0 vào thì bạn sẽ yêu cầu mang đến nó vào vòng lặp nhằm hiển thị câu chữ ra. Con khitruyền số 0 vào phía sau thì chương trình đang chỉ mang văn bản trong id đầu tiên.
Đối cùng với class chúng ta cũng làm tương tự như nlỗi sau, trả sử vào file phải rước gồm 3 class tên là content. Và chúng tamuốn lấy văn bản trường đoản cú class content thứnhì thị chúng ta có tác dụng nlỗi sau
$noidung = $html->find("https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg.content"https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg,1);Tiếp theo chúng ta cùng tìm hiểu biện pháp đem phần tử trong một trong những phần tử. lấy ví dụ cụ thể như sau trong câu chữ file nên lần có một id thương hiệu là properties. Trong properties tất cả một quãng text và một các mục list thuộc tính bên trong thẻ li. Bây giờ bạn cần lôi ra chuỗi li đấy để đưa vào dữ liệu hoặc xuất ra trang web thì có tác dụng nhỏng sau.
$thuoctinc = $html->find("https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg#properties"https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg,0)->find("https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpgli"https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg);foreach ($thuoctinch as $e) emang lại $e->plaintext;Mục đích của ví dụ này nhằm bạn gọi về kiểu cách cần sử dụng find lồng tự đó hoàn toàn có thể áp dụng vào những ví dụ ví dụ.
Lưu ý:trong thỏng viện này còn có cung ứng ta bố cách đọc câu chữ nlỗi sau
plaintext: Lấy văn bản (text) trường đoản cú trang webinnertext: Chỉ đem câu chữ phía bên trong thẻ..outertext: Lấy cả thẻ cùng văn bản phía bên trong.Tiếp theo họ cùng tò mò về kiểu cách đổi khác văn bản của một trang trước khi xuất dữ liệu ra. Giả sử các bạn tất cả một trang trong những số đó bao gồm 3 table cùng với các văn bản khác nhau,bạn có nhu cầu xóa table thứ nhất đi vì tất cả chứa lên tiếng không quan trọng thì có tác dụng nhỏng sau:
$html->find("https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpgtable"https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg,0)->outertext="https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg"https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpg;khi phải xóa một phần từ nào kia thi gán outertext = ''nlỗi ngơi nghỉ bên trên là đươc. Chúng tacó tác dụng tương tự cùng với các class với id. Giờ trường phù hợp đặt ra là chúng ta xóa một đoạn text phía bên trong một thẻ p nhưng lại trái ngang nuốm thẻ p này không mang tên class hoặc id nhưng mà chỉ bao gồm style như sau. Đây là mình đem từ ví dụ thực tiễn của bản thân khi làm cho dự án công trình trước tiên của mình.Hiện giờ ta đề nghị có tác dụng nhỏng sau để các loại text,
foreach ($html->find("https://obatambeienwasirherbal.com/lay-du-lieu-tu-website-khac-bang-php/imager_2_17604_700.jpgp