Stanza es un paquete de análisis de lenguaje natural de Python desarrollado por investigadores de la universidad de Stanford. El repositorio compartido para la infraestructura de Python. El objetivo de Stanza no es reemplazar las herramientas de modelado que elija, sino ofrecer implementaciones para patrones comunes útiles de experimentos en aprendizaje automático. Es un conjunto de herramientas que convierte una cadena de texto en lenguaje humano para:

  • Listas de oraciones y palabras.
  • Generar formas básicas de esas palabras, sus partes del discurso y características morfológicas.
  • Un análisis de dependencia de estructura sintáctica.
  • Reconocer entidades con nombre. 
  • Listas de oraciones y palabras. Generar formas básicas de esas palabras, sus partes del discurso y características morfológicas.
  • Un análisis de dependencia de estructura sintáctica.
  • Reconocer entidades con nombre. 

El diseño del kit de herramientas permite trabajar en paralelo entre más de 70 idiomas, utilizando el formalismo de Dependencias Universales. Stanza está construido con componentes de red neuronal de alta precisión, que también permiten una capacitación y evaluación eficiente con sus propios datos anotados. Los módulos están construidos sobre la biblioteca PyTorch.  Incluye una interfaz de Python para el paquete CoreNLP Java y hereda la funcionalidad adicional de allí como el análisis de la circunscripción, la resolución de la correferencia y la coincidencia de patrones lingüísticos. (Fuente: stanfordnlp.github.io/stanza).

  • Github: github.com/stanfordnlp/stanza.
  • pip install stanza: pypi.org/project/stanza.
  • Documentación Quicknav: stanza.readthedocs.io/en/latest
https://estadosia.files.wordpress.com/2020/03/stanza.png
Python NLP library. Crédito Imagen: (github.com/stanfordnlp/stanza).