Documentación de Oriloq

Transcripción

Esta página describe la configuración de transcripción: proveedor, modelo local, idioma preferido, dataset de fine-tuning y privacidad.

Objetivo

Elegir el motor de transcripción, configurar el modelo local, definir el idioma preferido y gestionar los datasets de fine-tuning.

Configuración de transcripción de Oriloq – proveedor, modelo MLX, idioma y dataset
Vista de la configuración de transcripción: proveedor, modelo MLX local, idioma y dataset de fine-tuning.

Proveedor de transcripción

Oriloq ofrece varios motores de transcripción. Usa el menú desplegable Motor para seleccionar el proveedor deseado (por ejemplo, Backend MLX Local). Cuando un backend local está activo, un indicador confirma su estado.

Modelo MLX Local

Selecciona el modelo de transcripción a través del menú desplegable Modelo. Cuando un modelo está listo, Oriloq muestra su estado («Modelo listo para usar») así como el espacio que ocupa en el disco. Ajusta el Presupuesto máximo de tokens para limitar el número de tokens generados por transcripción. Haz clic en Abrir carpeta de modelos para acceder al directorio en el Finder. Si el modelo aún no se ha descargado, haz clic en Descargar modelo para obtenerlo. Usa Eliminar modelo descargado para liberar espacio en disco. Nota: cambiar de modelo requiere reiniciar el backend.

Idioma de transcripción

Define el Idioma preferido a través del menú desplegable para indicar a Oriloq en qué idioma dictas principalmente. Este ajuste ayuda al modelo a optimizar el reconocimiento de voz para el idioma elegido.

Dataset de fine-tuning

Esta sección permite gestionar la carpeta de almacenamiento de las grabaciones utilizadas para el fine-tuning del modelo de transcripción. Oriloq muestra el número de grabaciones pendientes de validación y validadas. Usa Cambiar carpeta… para seleccionar otra ubicación, Abrir carpeta para acceder en el Finder, o Restablecer para restaurar la ruta predeterminada. Las grabaciones se organizan en las subcarpetas «Enregistrements_a_valider» y «Enregistrements_valides».

Proveedores cloud (opcionales)

Desde la versión 1.0.6, hay dos motores cloud disponibles directamente en el selector de modelos, sin necesidad de activar el modo desarrollador:

  • ElevenLabs Scribe — transcripción cloud con marcas de tiempo por palabra, corrección automática de la puntuación y alineación precisa (1.0.7).
  • Mistral Voxtral — motor cloud de Mistral. Una opción de idioma específica para Voxtral está disponible más arriba en esta sección.

Los resultados cloud se devuelven como texto plano coherente. Puedes en cualquier momento volver a transcribir localmente la misma captura si prefieres no recurrir al cloud.

Streaming Voxtral (beta)

Desde la versión 1.0.11, los primeros ajustes del modo streaming Voxtral están disponibles. Este modo prepara la transcripción en tiempo real a medida que hablas, sin esperar al final del segmento de audio. Aún está en beta: úsalo para experimentar y mantén la transcripción por segmentos para los usos críticos.

Gestión de memoria de los modelos

Desde la versión 1.0.11, una opción permite mantener los modelos de transcripción cargados en memoria entre dictados, para inicios casi instantáneos. La descarga se adapta automáticamente a la presión de memoria de tu Mac: si el sistema necesita RAM, Oriloq libera el modelo; si no, queda listo.

Un indicador en tiempo real del uso de memoria está disponible en la configuración de desarrollador (desde 1.0.6) para seguir la huella efectiva.

Información

El backend local garantiza una transcripción 100 % privada: tus datos de audio permanecen completamente locales en tu máquina y nunca se envían a un servidor externo.