Thumbnail

De audio/video a texto con Escribano Transcripciones

Nuestro servicio permite transcribir de forma automatizada, identificando participantes con una calidad superior al 85%*

Ofertas de lanzamiento. Consúltanos y pregunta por bonos de bienvenida y descuentos para nuestros clientes nuevos

Resultados 100x más rápido

Sin importar la cantidad de videos o audios que nos envíes, todos serán procesados en paralelo garantizando la entrega en 24 horas o menos. A veces, incluso en minutos.

Ahorro de tiempo

Reduce la operatividad

Reduce el trabajo operativo y el margen de error humano al tiempo que ahorras en costos entre el 30% y el 70% versus el modelo tradicional

Reducción de costos

Facilita el valor agregado

Enfócate en lo que realmente cuenta, agregar valor aprovechando al máximo el conocimiento de tu equipo

Generación de valor

Modelos disponibles

Feature

TEK

Escribano TEK es un modelo que ha sido diseñado para la transcripción de audios con un lenguaje más técnico, mejor calidad de sonido y grupos no tan grandes

Feature

FAST

Escribano FAST es un modelo 10X más rápido que TEK y se adecúa muy bien al lenguaje convencional. Tiene una mejor diarización con pocos participantes hasta sesiones de grupo tradicionales

Características de nuestras transcripciones

Optimizada
Original
Modelo técnico

TEK / optimizada

  • Análisis incluido con perfiles, hallazgos y recomendaciones
  • Identificación de speakers por número
  • Corrección de estilo y errores gramaticales
  • Ajuste de diarización
  • Recomendado para lenguaje técnico
  • Sistema de autocorrección sutil incorporado
  • Puede realizar traducción de texto
  • Ideal para entrevistas o sesiones pequeñas (4 personas)
  • Transcripción simultánea hasta de 5 audios

Cómo funciona

SVGFeature
01

Carga tus archivos

Selecciona y carga los archivos de audio o video que requieras transcribir. El sistema no te permitirá subir archivos con el mismo nombre en un mismo proyecto para evitar que tengas errores. Asegúrate que los audios tengan buena calidad y evita los silencios prolongados al inicio o al final del audio

SVGFeature
02

Selecciona el modelo y tipo de transcripción

Puedes elegir entre TEK o FAST para la transcripción, dependiendo de tu audio y los resultados que quieras obtener. También selecciona si prefieres el tipo Original u Optimizado. La transcripción optimizada brinda una curación de texto automatizada mejorando su compresión y su asignación en relación con los speakers participantes. Luego puedes hacer clic en el botón Procesar archivos

SVGFeature
03

Revisa el avance

El sistema te permite ver la cantidad de archivos y en que etapa están: - Etapa de procesamiento, Etapa de transcripción, Etapa de depuración

SVGFeature
04

Revisa y descarga los resultados

Puedes ver el detalle de cada archivo que hayas subido y conocer detalles como la duración y los tipos de transcripción generadas. También puedes descargar los resultados. En esta sección tienes la posibilidad de acceder a Escribano Análisis y comenzar a generar análisis personalizados con tu información (Escribano análisis aún se encuentra en versión beta)

Precio de nuestros modelos de transcripción

Precios y características incluidas en cada modelo

Transcripción Original

COP 257 / minuto

Inicia hoy
  • Transcripción automática literal y diarizada
  • 1 archivo para descarga
  • +10 idiomas
  • Prioridad normal
  • Soporte técnico incluido
  • Almacenamiento por 7 días
  • No tiene depuración o corrección de estilo
  • Acceso a nuevas funcionalidades
Personalizada Pro

COP 1016 / minuto

Inicia hoy
  • Transcripción con depuración humana y diarizada
  • 3 diferentes descargas
  • Solo inglés y español
  • Tiempo de entrega varía dependiendo del proyecto
  • Soporte técnico incluido
  • Depuración humana de asignación de speakers
  • Consúltanos antes de iniciar
FAQ'S

Preguntas Frecuentes

No. Nuestra infraestructura tecnológica no utiliza los modelos de OpenAI para realizar transcripciones. Nuestros modelos están hospedados en servidores diferentes a los de OpenAI, lo que nos permite garantizar el cuidado de la información.

Hay muchos elementos que se deben tener en cuenta al momento de realizar una transcripción automatizada. Entre otros, está la calidad del audio, la claridad de los participantes, la terminología utilizada, entre otros. Siempre es bueno hacer una prueba con varios modelos para encontrar el que mejor se ajuste en términos de resultados, costo y tiempo de entrega de resultados. Para conocer más, ve a nuestro Blog

Para comenzar, ninguna transcripción automatizada es 100% precisa. Así mismo, las necesidades y requerimientos de cada cliente son diferentes y mientras que para algunos es absolutamente necesario tener una transcripción con un nivel de certeza alto ya que esta puede ser parte de un entregable hacia algún tercero, para otros, la transcripción es una guía que les permite consultar las ideas principales de alguna conversación, entrevista, sesión, etc. Teniendo esto en mente, no necesariamente el modelo más costoso es el mejor. Nuestra transcripción original ha entregado muy buenos resultados en gran parte de los audios que hemos trabajado para varios de nuestros clientes y cubre sus necesidades. Sin embargo, en caso de requerirse una transcripción un poco más especializada, tenemos el modelo de transcripción optimizada que realiza mejoras en cuanto a la separación de los interlocutores, la gramática y redacción de las frases y la correcta escritura de las palabras. Aunque este modelo no alcanza un 100% de precisión como lo haría una curación humana, si mejora mucho la transcripción automatizada y permite conseguir una transcripción “curada” a un nivel bastante profesional. Por último, tenemos el servicio de Curación Humana, que a diferencia de los otros dos mencionados anteriormente, implica tiempos y costos mucho más altos y que recomendamos usar solo si es necesaria.

Escribano ofrece la opción de subir varios archivos al tiempo. Sin embargo, si es requerido, podemos trabajar con un Gateway Personalizado que permita procesar los archivos de nuestros clientes desde el origen, o generar una opción tipo “Batch” para subir archivos a nuestro sistema en modo “off-line”.

La diarización, o separación de los participantes puede tener un rendimiento deficiente si uno o algunos de ellos sólo participan una vez o con poca frecuencia a lo largo de la grabación. Adicionalmente, si el participante responde siempre con frases cortas o de una sola palabra, el modelo puede tener dificultades para identificar los participantes. Por último, si el tono de voz de los participantes en la grabación es muy similar, el sistema puede presentar dificultades para identificarlos y separarlos con precisión. Otros factores importantes que pueden impactar son el ruido de fondo, la participación simultanea de 2 o más participantes o el eco generado durante la grabación.

Para mejorar el rendimiento del modelo de reconocimiento de participantes, se recomienda asegurarse de que cada orador hable durante al menos 30 segundos ininterrumpidos. También puede ser útil evitar situaciones en las que una persona hable sólo unas pocas frases cortas como "Sí", "Correcto" o "Suena bien". Si es posible, evitar las conversaciones cruzadas también puede mejorar el rendimiento. Adicionalmente, la calidad de la grabación, incluidos los dispositivos usados para realizar dicha grabación, juegan un papel importante.

La precisión del modelo de reconocimiento depende de varios factores, como la calidad del audio, el número de hablantes y la longitud del archivo de audio. Asegurarse de que cada orador hable durante al menos 30 segundos ininterrumpidos y evitar escenarios en los que una persona sólo habla unas pocas frases cortas puede mejorar la precisión. Sin embargo, es importante tener en cuenta que el modelo no es perfecto y puede cometer errores, sobre todo en los escenarios más difíciles.

¿Quieres ver más?

Mira nuestro video en línea del funcionamiento de Escribano Transcripciones o ve a la página de contacto para agendar una demostración personalizada