shithub: opus

--- a/silk/dec_API.c

+++ b/silk/dec_API.c

@@ -104,8 +104,8 @@

         ret += silk_init_decoder( &channel_state[ 1 ] );

-    for( n = 0; n < decControl->nChannelsInternal; n++ ) {

-        if( channel_state[ n ].nFramesDecoded == 0 ) {

+    if( channel_state[ 0 ].nFramesDecoded == 0 ) {

+        for( n = 0; n < decControl->nChannelsInternal; n++ ) {

             opus_int fs_kHz_dec;

             if( decControl->payloadSize_ms == 0 ) {

                 /* Assuming packet loss, use 10 ms */

@@ -258,6 +258,7 @@

         } else {

             silk_memset( &samplesOut1_tmp[ n ][ 2 + delay ], 0, nSamplesOutDec * sizeof( opus_int16 ) );

+        channel_state[ n ].nFramesDecoded++;

     if( decControl->nChannelsAPI == 2 && decControl->nChannelsInternal == 2 ) {

--- a/silk/decode_frame.c

+++ b/silk/decode_frame.c

@@ -127,7 +127,6 @@

     /* Update some decoder state variables */

     psDec->lagPrev = sDecCtrl.pitchL[ psDec->nb_subfr - 1 ];

-    psDec->nFramesDecoded++;

     /* Set output frame length */

     *pN = L;

--- a/silk/enc_API.c

+++ b/silk/enc_API.c

@@ -222,6 +222,7 @@

                 psEnc->state_Fxx[ n ].sCmn.LBRR_flags[ i ] = 0;

+        psEnc->state_Fxx[ n ].sCmn.inDTX = psEnc->state_Fxx[ n ].sCmn.useDTX;

     silk_assert( encControl->nChannelsInternal == 1 || psEnc->state_Fxx[ 0 ].sCmn.fs_kHz == psEnc->state_Fxx[ 1 ].sCmn.fs_kHz );

@@ -435,10 +436,12 @@

                     if( ( ret = silk_encode_frame_Fxx( &psEnc->state_Fxx[ n ], nBytesOut, psRangeEnc, condCoding ) ) != 0 ) {

                         silk_assert( 0 );

-                    psEnc->state_Fxx[ n ].sCmn.nFramesEncoded++;

+                } else {

+                    psEnc->state_Fxx[ n ].sCmn.VAD_flags[ psEnc->state_Fxx[ n ].sCmn.nFramesEncoded ] = 0;

                 psEnc->state_Fxx[ n ].sCmn.controlled_since_last_payload = 0;

                 psEnc->state_Fxx[ n ].sCmn.inputBufIx = 0;

+                psEnc->state_Fxx[ n ].sCmn.nFramesEncoded++;

             psEnc->prev_decode_only_middle = psEnc->sStereo.mid_only_flags[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded - 1 ];

--- a/silk/fixed/encode_frame_FIX.c

+++ b/silk/fixed/encode_frame_FIX.c

@@ -69,9 +69,6 @@

     /**************************************************/

     /* Convert speech activity into VAD and DTX flags */

     /**************************************************/

-    if( psEnc->sCmn.nFramesEncoded == 0 ) {

-        psEnc->sCmn.inDTX = psEnc->sCmn.useDTX;

-    }

     if( psEnc->sCmn.speech_activity_Q8 < SILK_FIX_CONST( SPEECH_ACTIVITY_DTX_THRES, 8 ) ) {

         psEnc->sCmn.indices.signalType = TYPE_NO_VOICE_ACTIVITY;

         psEnc->sCmn.noSpeechCounter++;