ciao Sissa!
Felice di sapere hai già provato l'approccio fai-da-te, è un'ottima palestra.
Sta solo attenta per i caratteri strani nei nomi di file, per esempio se ci fosse un "&", per sicurezza apri il file con IE - a qualcosa ancora serve - per controllare che non dia errori di formattazione dell'XML. Se puoi, cerca di salvare in formato UTF-8
L'inclusione delle immagini nelle sitemap è una scelta, serve per sottoporle a Google che le indicizzi in Google Image Search. Personalmente non ne ho mai sentito il bisogno (cmq indicizzare bene delle immagini è abbastanza semplice).
Se il tuo sito è puramente statico, sapere il numero esatto di pagine è immediato, l'approccio di Emma Still nell'articolo (nel suo caso era un sito asp tradizionale, dove ogni pagina del sito corrisponde a una pagina .asp), ma devi comunque prestare un po' di attenzione a diversi particolari:
gli URL di pagine noindex vanno saltate
gli URL di pagine esclude da robots.txt vanno saltate
gli URL di risorse che risultano non essere html vanno saltate (a meno che tu non voglia includere alcuni contenuti speciali come pdf, immagini, video, usando dove serve la sintassi corretta)
gli URL le pagine soggette a password (non pubbliche) vanno saltate
gli URL le pagine con canonical tag diverso dal proprio url normalmente vanno saltate
...
se però è tutto pubblico e tutto index è facile.
Quando il sito invece non ha una corrispondenza 1:1 con il numero di file fisici è più complesso, allora devi fidarti di cosa ti dice lo spider; lo spider può poi evindenziarti problemi di contenuti duplicati dati da di cui magari non sei conscia (a me è capitato tante volte, è sorprendente per siti grossi quanti possano essere gli URL "accidentali").
Un buon spider poi è in grado di "normalizzare" gli URL ordinando i parametri in querystring, ignorando i parametri di sessione, risolvendo bene gli URL relativi, etc...
Su Xenu: non legge poche pagine, se ben ricordo non pone limiti tangibili nel numero degli URL.
Sul mio tool in versione italiana: ancora no, arriverà
Spero d'esserti stato utile, ciao!