Some tests on Speex codec

I've played around a bit with Speex, the free speech codec that can be embedded into Ogg packets. Thanks to Speexdrop, a very useful tiny GUI for Speex encoding, I've been able to encode an interview I've done recently into Speex.

There are two voices recorded in the file: the one of the person interviewed (female), and mine (male). The file is 1 minute 47 seconds long. I've set the complexity to 10, 1 frame is stored in each Ogg packet, the stereo sound has been downmixed to mono, VBR is on, and samplerate is 44100 Hz.

Here are the results:

Quality File size Average bitrate OK for broadcast?
0 173 kB 12.93 kbps no
1 196 kB 14.65 kbps no
2 222 kB 16.60 kbps no
3 257 kB 19.21 kbps nearly
4 306 kB 22.88 kbps nearly
5 348 kB 26.02 kbps nearly
6 377 kB 28.19 kbps nearly
7 445 kB 33.27 kbps nearly
8 528 kB 39.48 kbps yes
9 658 kB 49.20 kbps yes
10 684 kB 51.14 kbps yes

To my ears, being OK for broadcast means "better than a classic phone line".

Une échelle pour les statistiques Médiamétrie

Une idée qui a surgi sur irc.tryphon.org : comptabiliser les statistiques Médiamétrie en dBo[1] plutôt qu'en pourcentages ou en centaines d'auditeurs. Les variations sont plus facilement constatées, et plus significatives : la perte de 1000 auditeurs pour une grosse nationale ne veut pas dire la même chose pour une petite locale...

Radio Nombre d'auditeurs (2005)
Radio nationale 56000
Radio locale 1700

On calcule donc des valeurs en dBo en prenant comme valeur de référence 1000 auditeurs :

dBo = 10 * log[2](auditeurs / 1000)

Ce qui nous donne :

Radio Nombre d'auditeurs (2005) dBo
Radio nationale 56000 + 17,48
Radio locale 1700 + 2,30

Ensuite, pour calculer des différences d'une année sur l'autre, on utilise les B, ou plutôt leur sous-unité le cB :

cB = 100 * log(après / avant)

En diminuant chacune des deux radios de 1000 auditeurs, on obtient :

Radio Nombre d'auditeurs (2004) Nombre d'auditeurs (2005) cB
Radio nationale 57000 56000 - 0,76
Radio locale 1800 1700 - 2,48

Ici, les valeurs prennent du sens : en fonction de la taille de la radio, les variations sont plus ou moins importantes. Pourquoi ne pas utiliser les pourcentages, me direz-vous ? Eh bien parce que nous faisons de la radio, pas des statistiques ;)

Enfin, pour finir, et pour ceux qui - comme moi - on des problèmes avec les bels (aouéééé... c'est un log... mais comment on calcule la différence déjà ?), l'article Bel sur Wikipedia.

Notes

[1] Idée originale de Flow.

[2] Logarithme à base 10.

Tiens, une autre chanson que j'aime bien

Think what that money could bring
I'd buy everything
Clean out Vivienne Westwood
In my Galliano gown
No, wouldn't just have one hood
A Hollywood mansion if I could
Please book me first-class to my fancy house in London town

Gwen Stefani (feat. Eve) - Rich girl