На счет литературы посоветовать не могу - набирался понемногу из разных книжек и собственных шишек

, используя здравый смысл и немного элементарной математики.
На счет задержки - детектор в петле АРУ использует усреднение для получения оценки мощности входного сигнала. Т.е. если мощность меняется в окне усреднения, то детектор выдаст нечто среднее для отсчетов, попавших в окно, соответствующее оценке мощности для одного из прошлых отсчетов. Рассмотрим почему это может быть плохо - если мощность меняется по синусоидальному закону, то оценка, полученная для "ямы" синуса будет в худшем случае из-за задержки применяться к "горбу" - на выходе получим большие колебания мощности, чем на входе. Т.е. петля может стать нестабильной. Обычно это не проблема в системах АРУ (мощность меняется медленно), но все-же... Это все можно почерпнуть из науки Control Systems, где рассуждают об устойчивости и phase margin. Поэтому разумно сузить полосу петли АРУ реже обновляя значение усиления (вовсе не обязательно обновлять усиление для каждого входного отсчета и использовать скользящую оценку мощности - можно просто взять кусочек сигнала, подсчитать оценку мощности, применить ее для следующего кусочка и т.п. - фактически, для оценки мощности используем интегратор со сбросом)
На счет деления - аккумулятор должен использовать т.н. fractional arithmetic (можно почитать wiki про fixed-point arithmetic и Q (number format)). Это просто - внутри разрядов аккумулятора ставим точку. Разряды до точки соответствуют целой части, после точки - дробной (т.е. фактически при использовании таких чисел оставляем сколько нам нужно дробных разрядов). Положение точки нужно учитывать при умножении и делении, нужным образом сдвигая результат. Точка не влияет на реализацию сложения и вычитания (оно такое же как и для обычных fixed-point целых чисел) . Про это есть в книжке Koren Computer Arithmetic Algorithms, но я бы не стал ее читать только ради этого