Последовательный разбор элемента Dom

мне нужно разобрать следующий код

<ul class="zg_hrsr">
<li class="zg_hrsr_item">
<span class="zg_hrsr_rank">#15</span>
<span class="zg_hrsr_ladder">
in 
<a href="http://www.amazon.com/gp/bestsellers/digital-text/ref=pd_zg_hrsr_kstore_1_1">Kindle Store</a>
 > 
<a href="http://www.amazon.com/gp/bestsellers/digital-text/154606011/ref=pd_zg_hrsr_kstore_1_2">Kindle eBooks</a>
 > 
<a href="http://www.amazon.com/gp/bestsellers/digital-text/157325011/ref=pd_zg_hrsr_kstore_1_3">Nonfiction</a>
 > 
<a href="http://www.amazon.com/gp/bestsellers/digital-text/292975011/ref=pd_zg_hrsr_kstore_1_4">Lifestyle & Home</a>
 > 
<a href="http://www.amazon.com/gp/bestsellers/digital-text/156699011/ref=pd_zg_hrsr_kstore_1_5">Home & Garden</a>
 > 
<a href="http://www.amazon.com/gp/bestsellers/digital-text/156828011/ref=pd_zg_hrsr_kstore_1_6">Gardening & Horticulture</a>
 > 
<b>
<a href="http://www.amazon.com/gp/bestsellers/digital-text/156847011/ref=pd_zg_hrsr_kstore_1_7_last">Greenhouses</a>
</b>
</span>
</li>
<li class="zg_hrsr_item">
<span class="zg_hrsr_rank">#26</span>
<span class="zg_hrsr_ladder">
in 
<a href="http://www.amazon.com/gp/bestsellers/digital-text/ref=pd_zg_hrsr_kstore_2_1">Kindle Store</a>
 > 
<a href="http://www.amazon.com/gp/bestsellers/digital-text/154606011/ref=pd_zg_hrsr_kstore_2_2">Kindle eBooks</a>
 > 
<a href="http://www.amazon.com/gp/bestsellers/digital-text/157325011/ref=pd_zg_hrsr_kstore_2_3">Nonfiction</a>
 > 
<a href="http://www.amazon.com/gp/bestsellers/digital-text/292975011/ref=pd_zg_hrsr_kstore_2_4">Lifestyle & Home</a>
 > 
<a href="http://www.amazon.com/gp/bestsellers/digital-text/156699011/ref=pd_zg_hrsr_kstore_2_5">Home & Garden</a>
 > 
<a href="http://www.amazon.com/gp/bestsellers/digital-text/156828011/ref=pd_zg_hrsr_kstore_2_6">Gardening & Horticulture</a>
 > 
<b>
<a href="http://www.amazon.com/gp/bestsellers/digital-text/156849011/ref=pd_zg_hrsr_kstore_2_7_last">House Plants</a>
</b>
</span>
</li>
</ul>

и результат, который я хочу,

  • Sellers Rank: #266,715 Paid in Kindle Store (See Top 100 Paid in Kindle Store)
  • #15 in Kindle Store > Kindle eBooks > Nonfiction > Lifestyle & Home > Home & Garden > Gardening & Horticulture > Greenhouses
  • #26 in Kindle Store > Kindle eBooks > Nonfiction > Lifestyle & Home > Home & Garden > Gardening & Horticulture > House Plants

  • как я могу достичь этого? Все, что я знаю, это то, что я должен получить 'nodeValue' для каждого тега 'a', но я запутался в том, чтобы получить их все в моем требуемом формате, я думаю, мне следует использовать массив, но я не могу реализовать это из-за мой низкий уровень знаний..

    Руководство и помощь, пожалуйста. Мне нужна только структура xPath и массива (если это можно сделать с помощью массива) или альтернатива массиву.


    person Zaffar Saffee    schedule 02.02.2012    source источник
    comment
    Я бы порекомендовал здесь SimpleXML вместо DOM, потому что его намного проще использовать. Я не собираюсь писать за вас ваш код, однако, если вы просмотрите документацию SimpleXML, вы увидите примеры того, как его использовать. Если вы не можете заставить это работать из примеров, вам может понадобиться нанять программиста :)   -  person rdlowrey    schedule 03.02.2012


    Ответы (1)


    person    schedule
    comment
    вздох, еще раз, это работает здесь, я даже проверил это в этот раз, я не знаю, как вы это делаете ;) Вы уверены, что у вас есть именно этот HTML? - person Wrikken; 06.02.2012