Nov 13

Är du van vid att använda SimpleXML och trött på reguljära uttryck när du ska scrapea data från ”vanliga” webbsidor? Ta en kik på Simple HTML Dom. Du kan enkelt plocka ut delar av sidan med hjälp av enkla ”selectors” och du slipper oroa dig för långa regexps. Sedan vet jag inte om det är det mest optimala och snabbaste sättet sättet att hämta data från en sida, men så vitt jag vet så är inte reguljära uttryck det snabbaste heller. :)

Tänk på att Simple HTML Dom parsern kräver PHP5+