Corpus

Corpus trilingüe público de la OMC

A la luz de la importancia creciente de los estudios sobre el procesamiento de lenguajes naturales, en particular la traducción automática, y a fin de ayudar asimismo a los traductores de textos relacionados con el comercio internacional, la OMC está dispuesta a permitir el acceso a su corpus trilingüe público.

El corpus publicado contiene la mayoría de los documentos públicos de la OMC producidos desde el establecimiento de la Organización en 1995 hasta diciembre de 2018. Todos los documentos han sido traducidos por profesionales. El corpus se ha alineado por frases automáticamente y contiene metadatos, según se explica en el cuadro que figura a continuación. Aunque la calidad de la alineación es buena, no ha sido revisada. Por lo tanto, la OMC no puede garantizar la exactitud ni la integridad de las alineaciones.


ID

> Nº de identificación del registro

IdxID

> Registro del fichero

SegID

> Nº de identificación del segmento

BTYear

> Año del bitexto

BTPath

> Ruta del bitexto (correspondiente a la colección y la serie)

BTName

> Nombre del bitexto

SegSrc

> Texto origen

SegTgt

> Texto meta

Match

> Nº de frases (del texto origen-del texto meta) que forman este segmento

IdxDomain

> Nombre del dominio

El Corpus Público de la OMC está disponible en las tres combinaciones de pares de idiomas de trabajo de la OMC: inglés-español, inglés-francés y francés-español. Consta de 22 archivos (de 1 millón de líneas cada uno) y puede descargarse en un archivo comprimido (.zip) para cada par de idiomas.
Descargar el Corpus

Descargo de responsabilidad y condiciones de uso del Corpus Trilingüe Público de la OMC

La utilización del Corpus Trilingüe Público (inglés-español-francés) de la Organización Mundial del Comercio (OMC) -por cualquier persona, en cualquier contexto y con cualquier finalidad- estará sujeta al siguiente descargo de responsabilidad:

  • El Corpus Trilingüe Público de la OMC se publica sin garantía explícita o implícita de ningún tipo. En concreto, la OMC no formula específicamente ninguna garantía ni declaración en cuanto a la exactitud o la integridad de la información contenida en el Corpus Trilingüe Público de la OMC en cualquiera de sus tres idiomas -incluido el idioma original del documento- ni a las funciones, los metadatos o los programas informáticos incorporados en el Corpus.
  • En ningún caso se considerará que la OMC es responsable de cualquier pérdida, carga, perjuicio o daño (incluso en procedimientos penales) derivado de la presunta utilización del Corpus Trilingüe Público de la OMC. La utilización del Corpus Trilingüe Público de la OMC corre exclusivamente por cuenta y riesgo del usuario, que reconoce y acuerda específicamente que la OMC no es responsable de la conducta de ningún usuario. En el caso de que un usuario no esté satisfecho con alguno de los materiales facilitados en el Corpus Trilingüe Público de la OMC, lo único que puede hacer es dejar de utilizarlo.
  • Cuando utilice el Corpus Trilingüe Público de la OMC, el usuario debe citar a la OMC como fuente de la información.
  • Nada de lo aquí dispuesto constituirá o se considerará una limitación de los privilegios y las inmunidades de la OMC ni una renuncia expresa o tácita a estos, que se reservan específicamente.

Compartir


Si tiene problemas para visualizar esta página,
sírvase ponerse en contacto con [email protected], y proporcionar detalles sobre el sistema operativo y el navegador que está utilizando.