Кхе, посмотрел смоленский форум. Там типо голландцы получили мешок записей СБУ и признали их все подлинными. Уже говорил - все носятся с "К вам птичка полетела", которая никак не стыкуется по времянке возможностей комплекса Бук от слова совсем с учетом перезвонки на позицию и времени полета ракеты 36+-2с. Да и про точность целеуказания - молчим. Запись звонка из Горловки в Горловку. Самолет мог лететь из-под Николаева, Днепропетровска или Харькова. По совершенно разным маршрутам. Плюс разговор обрезан - видать там было то, что не устраивало авторов записи. Далее. Уже тысячу раз говорил. В мобилках используется вокодер. Это математическая модель абонента,а не сама оцифрованная речь человека. Голос человека формируется системой резонаторов и мышц, расположенных от легких до носа. Все это индивидуально и при точной оцифровке ИКМ даже 8 бит 8кГц обычно позволяет идентефицировать говорящего при достаточной длительности разговора. Стандартом является монолог 5 минут при соотношении сигнал-шум не менее 20дБ. В телефонном разговоре таких монологов практически не бывает (за исключением кухонно-салонных). Далее, канал связи стоит денег, данные приходится ужимать. И тут включается математика. Считается, что человек в нормальной обстановке не может быстро изменить параметры своего речевого тракта. Обычно считается, что достаточно зафиксировать эти параметры с дискретностью 20мс - так называемый слог. Даже если вы по телефону поете тирольские песни. Т.е. у нас есть 160 отсчетов АЦП на 8кГц на 20мс (кроме последнего AMR-WB, там может быть до 16кГц оцифровка) (именно во столько раз теоретически можно уменьшить поток данных в таких вокодерах), по которым строится модель речевого тракта человека. Очень сильно упрощенная модель.Но, берется еще пару десятков отсчетов из предыдущего слога и следующего - считается что голос не меняется, поэтому должна быть похожесть - корреляция. И решается система уравнений, по максимуму этой похожести-корреляции в соседних слогах. По решению системы составляется модель из импульсных возбудителей-резонаторов (грубо говоря - как церковный оргАн) и фильтра , наложенного на эту систему резонатров - ведь разные резонаторы на разных частотах присутствуют в результирующей речи с неодинаковыми уровнями. Более того, чем передавать саму систему резонаторов и фильтров, можно передавать или коротокое указание на заранее описанную и сохраненную модель в так называемой кодовой книге - один тип вокодеров с линейным предсказанием, или попытаться предсказать разницу с текущим слогом в следующем, ибо разница всегда проще полного описания текущего значения из-за огромной инерционности речевого тракта - другой тип этих же липредеров. Можно комбинировать оба этих метода, создавая гибридные вокодеры. И того имеем такого себе сильно упрощенного пародиста нашего абонента, а не самого абонента, как в случае обычной оцифровки, а мозг дорисовывает нам нашего знакомого - как Галкину было достаточно сказать "дорогие россияне" и перед нами уже не молодой стройный Алкин, а старый Алкогольцин. Во вторых, коррелятор - это штука, которая помогает сгладить скачки в речи, т.е. помогает скрыть монтаж. В-третьих. Бессмысленно передавать данные, когда абонент молчит. Поэтому существует система определения речевой активности. В момент, когда сигнал от микрофона опускается ниже порога, вокодер передает сообщение об этом и передача речевых данных прекращается. Чтобы слушающему абоненту не показалось, что его друг отрубился, на приемной стороне включается так называемый генератор комфортного шума. В результате слушающему кажется, что он слышит шумы трубки говорящего. И меня всегда прикалывало, когда горе-анализаторы,привыкшие к магзаписям или вокодерам без комфорт ноис, начинают искать места стыковки уровней шума при монтаже. На самом деле в GSM от HR и вплоть до AMR это идеальное место для монтажа, если у вас есть цифровая запись с эфира. На место сшивки декодер наложит идеально ровненький белый шум,скрывающий монтаж. Т.е. мы видим, что ни монтаж, ни определить говорящего с записи GSM невозможно техническими способами. Остается только субъективный в виде лингвиста. Но - уже говорил - ей (а это, как правило прекрасная половина человечества) нужна длительность монолога не менее 5 минут и отсутствие помех, плюс образец речи, желательно ИКМ, а еще лучше видео - где она видит артикуляцию, и не менее получаса. И она должна быть носителем языка. Поэтому когда мне говорят, что голландцы четко определили аутентичность перехватов - ржу-нимагу. Что касается Украины и наших экспертов-лингвистов - оба Саши, начальники КНИИСЭ и Экспертной службы СБУ, Рувин и Охрименко, ходят под люстрацией -руководили еще при Януковиче, поэтому объективно субъективны.
Отредактировано РВШ (2016-02-28 12:20:16)