Lenguajes

lenguajes.detectar_lenguaje(texto, devolver_proba=False)

Identifica el lenguaje en el que está escrito el texto de entrada.

Parámetros
  • texto (str) – Texto de entrada.

  • devolver_proba (bool, opcional) – Indica si se retorna el porcentaje de confiabilidad del lenguaje identificado. Valor por defecto False.

Devuelve

(str) Texto del lenguaje identificado siguiendo el estandar ISO 639-1. Si devolver_proba = True retorna una tupla.

lenguajes.lenguaje_tesseract(lenguaje)

Función auxiliar - Para un lenguaje de entrada, busca su equivalente en Tesseract.

Parámetros

lenguaje – (str) Corresponde al nombre del lenguaje a definir.

Devuelve

(str) Texto correspondiente al lenguaje identificado, de acuerdo a lo aceptado por Tesseract.

lenguajes.traducir_texto(texto, lenguaje_destino)

Permite traducir un texto de entrada.

Nota

Es importante tener en cuenta los siguientes aspectos al utilizar la función traducir_texto:

  • La función utiliza la librería googletrans, que hace uso de la API de Google Translate. Por lo tanto, se requiere tener una conexión a internet para su funcionamiento.

  • El límite máximo de caracteres en un solo texto es de 15.000.

  • Debido a las limitaciones de la versión web del traductor de Google, el uso de la API no garantiza que la librería funcione correctamente en todo momento.

  • Si desea utilizar una API estable, se recomienda el uso de la API de traducción oficial de Google.

  • Si recibe un error HTTP 5xx, probablemente se deba a que Google ha bloqueado su dirección IP.

  • Para mayor información puede consultar la documentación de la librería googletrans.

Parámetros
  • texto (str) – Texto de entrada.

  • lenguaje_destino ({'es', 'en', 'fr', 'ge'}) – Indica el lenguaje al que desea traducir el texto. Para mayor información, consultar la sección de Lenguajes soportados.

Devuelve

(str) Texto traducido.