De audio/video a texto con Escribano Transcripciones

Nuestro servicio permite transcribir de forma automatizada, identificando participantes con una calidad superior al 85%*

Ofertas de lanzamiento. Consúltanos y pregunta por bonos de bienvenida y descuentos para nuestros clientes nuevos

Resultados 100x más rápido

Sin importar la cantidad de videos o audios que nos envíes, todos serán procesados en paralelo garantizando la entrega en 24 horas o menos. A veces, incluso en minutos.

Ahorro de tiempo

Reduce la operatividad

Reduce el trabajo operativo y el margen de error humano al tiempo que ahorras en costos entre el 30% y el 70% versus el modelo tradicional

Reducción de costos

Facilita el valor agregado

Enfócate en lo que realmente cuenta, agregar valor aprovechando al máximo el conocimiento de tu equipo

Generación de valor

Modelos disponibles

TEK

Escribano TEK es un modelo que ha sido diseñado para la transcripción de audios con un lenguaje más técnico, mejor calidad de sonido y grupos no tan grandes

FAST

Escribano FAST es un modelo 10X más rápido que TEK y se adecúa muy bien al lenguaje convencional. Tiene una mejor diarización con pocos participantes hasta sesiones de grupo tradicionales

Características de nuestras transcripciones

Optimizada

Original

Modelo técnico

TEK / optimizada

Análisis incluido con perfiles, hallazgos y recomendaciones
Identificación de speakers por número
Corrección de estilo y errores gramaticales
Ajuste de diarización
Recomendado para lenguaje técnico
Sistema de autocorrección sutil incorporado
Puede realizar traducción de texto
Ideal para entrevistas o sesiones pequeñas (4 personas)
Transcripción simultánea hasta de 5 audios

Popular

Modelo convencional

FAST / optimizada

Análisis incluido con perfiles, hallazgos y recomendaciones
Identificación de speakers por nombre (85%+ efectividad)
Corrección de estilo y errores gramaticales
Ajuste de diarización
Recomendado para lenguaje cotidiano
Mejor asignación de signos de puntuación
Alto nivel de separación de speakers
Ideal para entrevistas y sesiones de hasta 8 personas
Procesamiento exclusivo para mayor simultaneidad

Cómo funciona

01

Carga tus archivos

Selecciona y carga los archivos de audio o video que requieras transcribir. El sistema no te permitirá subir archivos con el mismo nombre en un mismo proyecto para evitar que tengas errores. Asegúrate que los audios tengan buena calidad y evita los silencios prolongados al inicio o al final del audio

02

Selecciona el modelo y tipo de transcripción

Puedes elegir entre TEK o FAST para la transcripción, dependiendo de tu audio y los resultados que quieras obtener. También selecciona si prefieres el tipo Original u Optimizado. La transcripción optimizada brinda una curación de texto automatizada mejorando su compresión y su asignación en relación con los speakers participantes. Luego puedes hacer clic en el botón Procesar archivos

03

Revisa el avance

El sistema te permite ver la cantidad de archivos y en que etapa están: - Etapa de procesamiento, Etapa de transcripción, Etapa de depuración

04

Revisa y descarga los resultados

Puedes ver el detalle de cada archivo que hayas subido y conocer detalles como la duración y los tipos de transcripción generadas. También puedes descargar los resultados. En esta sección tienes la posibilidad de acceder a Escribano Análisis y comenzar a generar análisis personalizados con tu información (Escribano análisis aún se encuentra en versión beta)

Precio de nuestros modelos de transcripción

Precios y características incluidas en cada modelo

Transcripción Original

COP 257 / minuto

Inicia hoy

Transcripción automática literal y diarizada
1 archivo para descarga
+10 idiomas
Prioridad normal
Soporte técnico incluido
Almacenamiento por 7 días
No tiene depuración o corrección de estilo
Acceso a nuevas funcionalidades

Transcripción Optimizada

COP 425 / minuto

Inicia hoy

Transcripción depurada automáticamente con mejora en la diarización
2 diferentes archivos para descarga
+10 idiomas
Prioridad mayor
Soporte técnico incluido
Almacenamiento por 15 días
Corrección de estilo automática
Acceso prioritario a nuevas funcionalidades

Personalizada Pro

COP 1016 / minuto

Inicia hoy

Transcripción con depuración humana y diarizada
3 diferentes descargas
Solo inglés y español
Tiempo de entrega varía dependiendo del proyecto
Soporte técnico incluido
Depuración humana de asignación de speakers
Consúltanos antes de iniciar

FAQ'S

Preguntas Frecuentes

No. Nuestra infraestructura tecnológica no utiliza los modelos de OpenAI para realizar transcripciones. Nuestros modelos están hospedados en servidores diferentes a los de OpenAI, lo que nos permite garantizar el cuidado de la información.

Hay muchos elementos que se deben tener en cuenta al momento de realizar una transcripción automatizada. Entre otros, está la calidad del audio, la claridad de los participantes, la terminología utilizada, entre otros. Siempre es bueno hacer una prueba con varios modelos para encontrar el que mejor se ajuste en términos de resultados, costo y tiempo de entrega de resultados. Para conocer más, ve a nuestro Blog

Para comenzar, ninguna transcripción automatizada es 100% precisa. Así mismo, las necesidades y requerimientos de cada cliente son diferentes y mientras que para algunos es absolutamente necesario tener una transcripción con un nivel de certeza alto ya que esta puede ser parte de un entregable hacia algún tercero, para otros, la transcripción es una guía que les permite consultar las ideas principales de alguna conversación, entrevista, sesión, etc. Teniendo esto en mente, no necesariamente el modelo más costoso es el mejor. Nuestra transcripción original ha entregado muy buenos resultados en gran parte de los audios que hemos trabajado para varios de nuestros clientes y cubre sus necesidades. Sin embargo, en caso de requerirse una transcripción un poco más especializada, tenemos el modelo de transcripción optimizada que realiza mejoras en cuanto a la separación de los interlocutores, la gramática y redacción de las frases y la correcta escritura de las palabras. Aunque este modelo no alcanza un 100% de precisión como lo haría una curación humana, si mejora mucho la transcripción automatizada y permite conseguir una transcripción “curada” a un nivel bastante profesional. Por último, tenemos el servicio de Curación Humana, que a diferencia de los otros dos mencionados anteriormente, implica tiempos y costos mucho más altos y que recomendamos usar solo si es necesaria.

Escribano ofrece la opción de subir varios archivos al tiempo. Sin embargo, si es requerido, podemos trabajar con un Gateway Personalizado que permita procesar los archivos de nuestros clientes desde el origen, o generar una opción tipo “Batch” para subir archivos a nuestro sistema en modo “off-line”.

La diarización, o separación de los participantes puede tener un rendimiento deficiente si uno o algunos de ellos sólo participan una vez o con poca frecuencia a lo largo de la grabación. Adicionalmente, si el participante responde siempre con frases cortas o de una sola palabra, el modelo puede tener dificultades para identificar los participantes. Por último, si el tono de voz de los participantes en la grabación es muy similar, el sistema puede presentar dificultades para identificarlos y separarlos con precisión. Otros factores importantes que pueden impactar son el ruido de fondo, la participación simultanea de 2 o más participantes o el eco generado durante la grabación.

Para mejorar el rendimiento del modelo de reconocimiento de participantes, se recomienda asegurarse de que cada orador hable durante al menos 30 segundos ininterrumpidos. También puede ser útil evitar situaciones en las que una persona hable sólo unas pocas frases cortas como "Sí", "Correcto" o "Suena bien". Si es posible, evitar las conversaciones cruzadas también puede mejorar el rendimiento. Adicionalmente, la calidad de la grabación, incluidos los dispositivos usados para realizar dicha grabación, juegan un papel importante.

La precisión del modelo de reconocimiento depende de varios factores, como la calidad del audio, el número de hablantes y la longitud del archivo de audio. Asegurarse de que cada orador hable durante al menos 30 segundos ininterrumpidos y evitar escenarios en los que una persona sólo habla unas pocas frases cortas puede mejorar la precisión. Sin embargo, es importante tener en cuenta que el modelo no es perfecto y puede cometer errores, sobre todo en los escenarios más difíciles.

¿Quieres ver más?

Mira nuestro video en línea del funcionamiento de Escribano Transcripciones o ve a la página de contacto para agendar una demostración personalizada

Ver el video

De audio/video a texto con Escribano Transcripciones

Resultados 100x más rápido

Reduce la operatividad

Facilita el valor agregado

Modelos disponibles

TEK

FAST

Características de nuestras transcripciones

Modelo técnico

TEK / optimizada

Modelo convencional

FAST / optimizada

Cómo funciona

01

Carga tus archivos

02

Selecciona el modelo y tipo de transcripción

03

Revisa el avance

04

Revisa y descarga los resultados

Precio de nuestros modelos de transcripción

Precios y características incluidas en cada modelo

Transcripción Original

COP 257 / minuto

Transcripción Optimizada

COP 425 / minuto

Personalizada Pro

COP 1016 / minuto

FAQ'S

Preguntas Frecuentes

¿Utilizan ChatGPT para realizar las transcripciones o análisis de Escribano?

¿Cómo puedo mejorar los resultados de mi transcripción?

¿Es la depuración humana el mejor modelo para trabajar mis transcripciones?

Ya tengo un sistema ordenado donde almaceno mis archivos. ¿Debo subir todos los archivos uno por uno a la plataforma de Aigoritmo?

¿Por qué en algunos casos el reconocimiento o separación de los interlocutores en un audio no es el esperado?

¿Cómo puedo mejorar el reconocimiento de los participantes en una grabación?

¿Qué tan preciso es el modelo de reconocimiento de participantes?

¿Quieres ver más?