Problema Localización de Páginas Web

¡Hola! Me llamo Josu y soy estudiante de Traducción e Interpretación en la Universidad del País Vasco. Os escribo en busca de ayuda, ya que en un proyecto para la carrera nos han pedido traducir una página web. Visto que soy novato en este sector, me gustaría saber si podríais ayudarme con una duda (problema, más bien) que tengo. ¿Cómo puedo extraer todo el texto de una Página web para así poder tener todas las subdivisiones en formato .html?

Os estaría inmensamente agradecido si pudierais ayudarme, y en su defecto, os agradecería en el alma que me facilitaseis el contacto de algún localizador de páginas web.

¡Muchísimas gracias!

¡Hola, @josubasterragilabert!

Te recomiendo que te des una vuelta por el siguiente hilo, ya que trata lo mismo (aunque se hable de Wix):

Siempre puedes recurrir a HTTrack; aunque no se use en el mundo profesional, para los fines de la carrera de Traducción e Interpretación debería valer:

Un saludo,

Pablo