Ух, что нашел.
Краткие итоги.
TMS320C6726 позволил одновременно обрабатывать 120 каналов, считать мощности в каналах, детектировать DTMF, производить анализ импульсного набора + анализ 425Гц. Плюс еще что-то делать по мелочи. Уперся скорее в пропускную способность DMA и объем памяти (Работал с буфером, а не по мере поступления отсчетов), чем в производительность процессора.
Из интересного вспоминается, как очень резко удалось поднять производительность развернув циклы.
Вместо
Код
while (i<BUFSIZE)
{
x2 = x1;
x1 = x;
x = shortaddr[i++] + f_coef*x1 - x2;
}
return (x2*x2 + x*x - f_coef*x2*x);
использовал одновременный расчет 3 отсчетов.
Компилятор гораздо лучше смог оптимизировать это дело. За счет этого раза в 2, что-ли, скорость повысилась.
Код
while (i<BUFSIZE)
{
x = shortaddr[i++] + f_coef*x1 - x2;
x2 = shortaddr[i++] + f_coef*x - x1;
x1 = shortaddr[i++] + f_coef*x2 - x;
}
x = shortaddr[i++] + f_coef*x1 - x2;
x2 = shortaddr[i++] + f_coef*x - x1;
return (x2*x2 + x*x - f_coef*x2*x);