전화선상 음성 : 4 KHz
샘플링은 최소 8 KHz
1 초에 8000 개의 샘플 / 한 샘플당 8 bit
8000 * 8 bit => 64000 bit 1초당 : 64 Kbps
T1 (24채널) : 1.544 Mbps급
E1 (32채널) : 2.048 Mbps급
//////////////////////////////////////////////////////////////////////////////////////
인코딩 타임 : 특정 코덱을 사용해서 아날로그 음성을 디지털 시그널로 변환하는데 걸리는 시간
DSP 칩에서 하나의 음성 프레임 output을 내보내는데 걸리는 처리 시간
G.711 PCM 64 Kbps 10ms 4.1
G.729 CS-ACELP 8 Kbps 10ms 3.9
G.711 경우 디폴트 페이로드 사이즈 : 160 byte
G.711 코덱은 10ms마다 아날로그 상태인 음성을 디지털로 바꾼다.
즉, DSP를 통해서 음성 output 샘플이 10 ms마다 생김
패킷을 구성할 때는 이러한 output 2개를 모은다.
G.711 64 Kbps
초당 64,000 bit // 초당 8,000 byte
1000 ms 당 8,000 byte => 10 ms 당 80 byte / 20 ms 당 160 byte
///////////////////////////////////////////////////////////////////////////////////////////
IP 네트워크를 통해 음성 프레임을 전달하려면
RTP, UDP, IP 헤더가 필요.. 각각
RTP 헤더 12 byte +
UDP 헤더 8 byte +
IP 헤더 20 byte +
Ethernet 헤더 18 byte => 58 byte
이러한 패킷화 타임 20 ms => 초당 50회 발생
58 byte * 8 = 464 bit
464 bit * 50번 = 23.2 Kbps
즉, 헤더 23.2 Kbps / 페이로드 64 Kbps
G.711 경우 한 통화당 필요한 대역폭은
23.2 Kbps + 64 Kbps = 87.2 Kbps