char [0] , char [1] 의미? (출처 http://minjang.egloos.com/2254472)

출처 http://minjang.egloos.com/2254472

물론 고수님들에겐 쉬운 문제지만 다음 구조체에서 char data[1]의 역할이 무엇인지 생각 해봅시다.

typedef struct tagWHATTHE {


  int    data1;


  int    data2;


  char   data[1];


} WHATTHE;

모르시는 분들은 최소 1분 정도 생각을 해봅시다.

그래도 잘 모르겠으면 약간의 힌트:

typedef struct tagWHATTHE {


  int    size;


  int    type;


  char   data[1];


} WHATTHE;

char data[1]의 역할은

난생 처음 이런 구조체를 보면 data[1] 변수가 도대체 어떤 의미인지 감을 잡기 힘들다. 왜 이런 변수가 쓰이는지는 직접 예제 코드를 보는 것이 가장 좋을 것 같다.

typedef struct tagHEADER {


  int  size;


  int  type;


  char data[1];


} HEADER;




// int data_length, int* data;


HEADER* hd = (HEADER*)malloc(sizeof(HEADER) + data_length);


hd->size   = sizeof(HEADER) + data_length;


hd->type   = 0;


memcpy(hd->data, data, data_length);


fwrite(hd, 1, hd->size, file_handle);

한 마디로 char data[1]의 의미는 길이가 정해지지 않은 데이터를 담기 위한 일종의 더미 변수라고 보면 된다. 예에서도 있듯이 이런 코딩 테크닉은 어떤 데이터의 헤더를 표현할 때 많이 등장한다. 메모리 덩어리를 할당 받고 그것을 이 헤더 타입으로 캐스팅을 하면 앞 부분은 헤더가 놓이고 바로 뒤에 갖고 싶은 가변 길이 데이터를 쉽게 이을 수 있다. 윈도우 프로그래밍을 해보신 분이라면 아마 이런 것을 자주 봤을 것이다. 예를 들면:

typedef struct _RGNDATAHEADER {


  DWORD dwSize;


  DWORD iType;


  DWORD nCount;


  DWORD nRgnSize;


  RECT  rcBound;


} RGNDATAHEADER;




typedef struct _RGNDATA {


  RGNDATAHEADER rdh;


  char          Buffer[1];


} RGNDATA;

RGN이라는 그래픽에서 그리는 영역을 지정하는 클리핑 객체를 담는 자료구조다. RGNDATA에 채워질 데이터가 몇 개나 올지 알 수 없으므로 이렇게 하였다. 또, 대표적인 비트맵 파일 관련 구조체도 빼놓을 수 없다.

typedef struct tagBITMAPINFO {


  BITMAPINFOHEADER bmiHeader;


  RGBQUAD          bmiColors[1];


} BITMAPINFO;

배열 크기가 여기는 [1]인데 [0]으로 둬도 사실 문제 없다. 그리고 소켓 프로그래밍할 때 보게 되는 hostent에도 이제는 과거 호환성 때문에만 남았지만 크기가 0인 배열을 볼 수 있다. 그런데 보통 크기 0인 배열을 선언하면 컴파일러가 워닝을 띄운다. 그래서 C99 표준에는 flexible array member라고 해서 맨 마지막 구조체 변수의 선언이 char data[] 처럼 될 수 있도록 하기도 한다.

도대체 왜?

그렇다면 왜 이렇게 했을까? 보다 직관적으로 코드를 만든다면 아래처럼 쓸 수도 있다.

typedef struct tagHEADER {


  int   size;


  int   type;


  char* data;


} HEADER;




HEADER* hd = (HEADER*)malloc(sizeof(HEADER));


hd->size = 1024;


hd->type = 0;


hd->data = (char*)malloc(hd.size);


...

그러나 이 접근은 단점이 있다. 위에서 예를 들었듯이 이 자료구조를 파일에 쓴다고 하면 헤더 부분 따로 그리고 data 영역을 따로 두 번에 걸쳐 파일 쓰기를 해야 한다. 결국 이 말은 이 자료구조에 접근하려면 헤더 한번, 실제 한번, 즉 두 번의 참조가 필요하다는 이야기다.

여기서 쪼잔하게 따지면 위 코드는 데이터 참조의 지역성(locality)이 줄어들어 캐시 미스를 한번 더 유발할 수 있는 단점도 있다. 요즘 프로세서들 캐시가 수 메가 바이트니 이 정도 괜찮다라는 생각을 함부로 하지 말자. 정말 성능이 중요한 프로그램은 이런 사소한 지역성 차이에서 오는 차이를 결코 무시할 수 없다. 비슷한 예로 “구조체의 배열(Array of Structure)” 이냐 “배열의 구조체(Structure of Array)”라는 문제도 있다 (우리말과 영어의 어순이 반대라 이거 이름이 참 헷갈린다). 간단한 예를 보면..

구조체의 배열(Array of Structure, AoS):

struct {


  double x;


  double y;


  double z;


} vector[4];

배열의 구조체(Structure of Array, SoA):

struct {


  double x[4];


  double y[4];


  double z[4];


} vector_set;

각각 상황에 따라 적절히 선택해서 골라야 한다. 사소해 보이지만 경우에 따라 큰 성능 차이가 나타날 수 있다.

AoS 같은 접근은 루프 한 순회에서 모든 원소들이 접근될 때 유리하다. vector[i]을 읽으면 일단 i번 째 x, y, z는 모두 캐시에 올라오기 때문이다. 반면 원소는 3개인데 루프에서 고작 x원소만 접근 된다면? 이 vector 배열이 매우 크다면 손실은 심각하다. 그럴 때는 SoA 구조가 바람직하다. 그 외에도 사소한 영향을 더 생각할 수 있지만 생각보다 글이 길어져서 이쯤에서 그만..

한줄요약: char data[1]; 같은 것이 보여도 쫄지 맙시다.

저작자표시

'Programing > c/c++' 카테고리의 다른 글

람다 샘플 코드2 (0)	2011.10.28
람다 샘플 코드 (0)	2011.10.28
MECRO 사용. 정의된 MECRO메크로 .....define ##의 사용 (0)	2011.02.11
비쥬얼 스튜디오 스타일 scheme (0)	2010.12.08

CASHBACK

char [0] , char [1] 의미? (출처 http://minjang.egloos.com/2254472)

char data[1]의 역할은

도대체 왜?

'Programing > c/c++' 카테고리의 다른 글

티스토리툴바

char [0] , char [1] 의미? (출처 http://minjang.egloos.com/2254472)

char data[1]의 역할은

도대체 왜?

'Programing > c/c++' 카테고리의 다른 글

'Programing/c/c++' Related Articles

티스토리툴바