HCrwl: Difference between revisions

From Slackopedia
No edit summary
No edit summary
Line 4: Line 4:
* Effektivare datastrukturer.  
* Effektivare datastrukturer.  
** Set för 'visited'.
** Set för 'visited'.
* Hantera DNS timeout
* Hantera DNS timeout snyggare, åtm begränsa catchen till rätt exception.
* Hitta XHTML parser
* Hitta XHTML parser

Revision as of 00:01, 18 February 2007

En liten växande crawler.

TODO

  • Effektivare datastrukturer.
    • Set för 'visited'.
  • Hantera DNS timeout snyggare, åtm begränsa catchen till rätt exception.
  • Hitta XHTML parser