데이터타입
데이터베이스에서 사용되는 데이터 타입은 각 DBMS(데이터베이스 관리 시스템)마다 다를 수 있지만, 일반적으로 사용되는 데이터 타입은 다음과 같습니다:
1. 문자형 데이터 타입 (String Types)
- CHAR(n) : 고정 길이 문자열. n은 문자열의 길이.
- VARCHAR(n) : 가변 길이 문자열. n은 최대 길이를 지정.
- TEXT : 긴 텍스트 데이터를 저장하는 데 사용 (길이 제한이 없음).
2. 숫자형 데이터 타입 (Numeric Types)
- INT : 정수형 데이터. 크기나 범위는 DBMS에 따라 다를 수 있음.
- BIGINT : 더 큰 범위의 정수형 데이터.
- FLOAT : 부동소수점 숫자 (소수점을 포함한 수).
- DOUBLE : 더 정확한 부동소수점 숫자.
- DECIMAL(p, s) : 고정 소수점 숫자. p는 총 자릿수, s는 소수점 아래 자릿수.
3. 날짜와 시간 데이터 타입 (Date and Time Types)
- DATE : 날짜(년, 월, 일).
- TIME : 시간(시, 분, 초).
- DATETIME : 날짜와 시간을 포함한 데이터.
- TIMESTAMP : 타임스탬프. 주로 시스템 시간이 자동으로 기록되는 용도로 사용.
- YEAR: 연도.
4. 불리언 데이터 타입 (Boolean Type)
- BOOLEAN : 참(True) 또는 거짓(False)을 나타내는 데이터 타입.
5. 이진 데이터 타입 (Binary Data Types)
- BINARY(n) : 고정 길이 이진 데이터.
- VARBINARY(n) : 가변 길이 이진 데이터.
- BLOB : 이진 대용량 객체(Binary Large Object). 이미지, 오디오, 비디오 파일 등을 저장.
이 외에도 각 DBMS에는 특정 기능에 맞는 추가적인 데이터 타입들이 존재할 수 있습니다. 예를 들어, MySQL은 `JSON`, PostgreSQL은 `JSONB`와 같은 JSON 데이터 타입을 지원합니다.
다양한 데이터 타입이 있지만 각 DBMS별로 명칭이 다를 수 있다는 점은 꼭 알아야 합니다. 사실상 데이터타입의 큰 분류만 알면 된다는 점만 꼭 알고 있으면 됩니다.
특히 실무에서 정형데이터를 다루는 데이터분석가들이 문자, 숫자, 날짜에 대한 타입을 자주 사용한다고 알고 있으면 되고요, 데이터타입은 꽤나 민감한 부분이라고 볼 수 있습니다. 데이터 전처리 등을 하는데 오류가 많이 발생할 수 있는 부분이며, sql작성 시 데이터 타입의 형뱐환을 많이 사용하기 때문에 데이터분석가를 꿈꾸는 사람이라면 꼭! 집고 넘어갈 수 있도록 해야 합니다.