El balbuceo de burbujas es un método de codificación en el que la información binaria se representa como pseudopalabras compuestas por vocales y consonantes alternas. Se utiliza principalmente para representar huellas digitales criptográficas. Creado por Antti Huima, el método de balbuceo hace que sea más fácil para las personas recordar y repetir información importante fácilmente. La codificación también tiene corrección de errores y redundancia incorporadas, lo que hace posible detectar cualquier error en la transcripción.
La metodología nació para ayudar a las personas a pronunciar y recordar códigos hexadecimales de una manera más natural. A veces es necesario validar verbalmente una clave por teléfono o mediante algún otro sistema. Estas claves públicas y los valores hash de los certificados importantes se denominan huellas digitales o huellas digitales. Este tipo de impresiones son vitales para verificar datos confidenciales por razones de seguridad. Por lo general, se representan como cadenas largas de dígitos hexadecimales.
Es difícil para las personas pronunciar, recordar y repetir largas cadenas de números de manera confiable por teléfono, por ejemplo. Huima creó el código para abordar este problema con el fin de representar fácilmente datos binarios olvidables en pseudopalabras más memorables. El término en sí es un juego de palabras con el clásico videojuego Bubble Bobble. Cuando se codifican dígitos hexadecimales mediante el método de codificación de balbuceo de burbujas, las palabras generadas se asemejan a balbuceos o galimatías.
Esto también resulta útil en situaciones en las que las claves de cifrado válidas se han perdido o no están disponibles. En este caso, la huella digital de la clave debe ser verificada por el usuario que recuerda la clave original. Las huellas digitales codificadas mediante la codificación de balbuceo de burbujas suelen ser más fáciles de recordar que sus versiones hexadecimales. Esto marca la diferencia en situaciones críticas en lugar de tener que aceptar una huella digital sin autenticarla de ninguna manera.
Para detectar errores de transmisión o codificación no válida, el método de codificación de balbuceo contiene una función de suma de verificación. Los marcadores que representan el inicio y el final de una determinada cadena de números también se incorporan a la codificación. Por cada dos bytes en la secuencia de entrada, la salida aparece como un guión y cinco caracteres. Una de las ventajas de este método es que no aumenta la longitud de la información codificada.
Las pseudopalabras se hacen usando vocales y consonantes de cierta manera: los números entre cero y cinco se mapean con vocales como 0-a, 1-e, 2-i y así sucesivamente en la tabla de vocales. Los números enteros entre cero y 16 se mapean como 0-b, 1-c, 2-d y así sucesivamente en la tabla de consonantes. Cada vocal de la pseudopalabra resultante tiene 0.58 bits de redundancia. La información de la suma de comprobación sería de alrededor de 4,640 bits para una cadena de 1,000 palabras, lo que es útil para detectar errores como bits invertidos.