문돌이 존버/DB 및 SQL 스터디
2021. 2. 17.
TPC-H 데이터베이스(DB) 데이터 활용법
TPC-H는 DB 성능 벤치마크라고 합니다. 빅데이터를 얼마나 효율적으로 처리하는 지에 대한 평가 측정이라고 생각하시면 되겠습니다. 실제 기업(real world)에서 다루는 데이터 양이 엄청나니 이를 어떻게 처리하는 것이 시스템적으로도 좋고, 속도 면에서도 좋은 모습을 보이는지가 중요하겠죠. 본격적으로 TPC-H의 샘플 데이터를 사용하기 위해 우선 우분투 터미널에서 gcc(gnu compiler collection)를 설치해보겠습니다. 아래 회색 박스 내부에 있는 명령어는 모두 우분투 터미널에서 이루어짐을 알려드립니다. gcc: 리눅스 환경에서 사용하는 컴파일러(초기 C/C++을 지원하다가 현재는 자바, 포트란, 에이다 등 여러 프로그래밍 언어를 지원한다고 함) sudo apt install build..