Desde hace tiempo estaba buscando esta librería muy útil para parsear código HTML, pues bien ayer tuve la fortuna de encontrarla y hoy quiero compartirla con ustedes, esta librería se llama «PHP Simple HTML DOM Parser»

// Extraer el código HTML
echo file_get_html(‘http://www.google.com/’)->plaintext;

// Obtener todos los enlaces
$ret = $html->find(‘a‘);

// todas las divisiones con el atributo id=’foo’
$ret = $html->find(‘div[id=foo]‘);

// Todas las divisiones con que contengan el atributo «id»
$ret = $html->find(‘div[id]‘);

// Elementos con «id=foo»
$ret = $html->find(‘#foo‘);

//Todos los elementos <li> dentro de <ul>
$es = $html->find(‘ul li‘);

// Todas las divisiones  anidadas hasta profundidad 3
$es = $html->find(‘div div div‘);

// Todos los<td> en<table>
$es = $html->find(‘table.hello td‘);

Estas son algunas funciones útiles al momento de parsear código HTML con PHP.

Te invito a darle una leida a la documentación online.

Sitio oficial. http://simplehtmldom.sourceforge.net/

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *