[Java] FILE - 바이너리(Binary) 파일과 텍스트(Text) 파일 포스팅
in Java on Java File I/O
컴퓨터의 파일에는 크게 2종류로 바이너리 파일(이진파일)
과 텍스트파일
이다.
카테고리가 java는 아니지만 java 개발 하다 작성하니. 하여튼 바이너리 파일과 텍스트 파일과 간단하게 비트와 바이트 설명에 대한 포스팅이다.
비트(Bit, binary digit)
- BInary(이진법의) digiT(숫자) = bit
- 하나의 비트는 0이나 1의 값을 가질 수 있고
- 컴퓨터의 가장 작은 단위
- 데이터를 처리, 저장, 전송 할 때 사용
- 정보의 기본단위 ‘바이트(Byte)’
바이트(Byte)
- 데이터 파일의 크기
- 디스크 또는 그 외 저장 매체의 공간
- 네트워크를 통하여 전송 되는 데이터의 양을 표현하는데 사용 되는 측정 단위
- 1바이트는 8비트 (1Byte = 8bit) 와 같다.
- CPU가 이해할 수 있는 언어가 바이너리 코드라면 바이트 코드는 가상 머신이 이해할 수 언어이다.
바이트 코드 예
- java에서는 컴파일러(javac)에 의해 소스파일(.java) > 목적파일(.class)로 변환될 때 컴퓨터가 바로 인식할 수 있는 바이너리코드가 아닌 바이트 코드로 변환
바이너리 파일(Binary, 이진 파일)
바이너리(Binary, 2진수) 코드
- 컴퓨터가 인식할 수 있는 0과 1로 구성된 이진코드
바이너리 파일
- 0과 1로 이루어진 코드로 변환. 즉, 컴파일 후에 이미 컴퓨터가 이해할 수 있는 이진코드로 변환된 것
- 우리가 많이 사용하는 이미지 파일(.jpg), 음악파일(.mp3), 실행 파일(.exe), 텍스트 파일(.txt)등이 바이너리 파일에 해당된다. 즉 바이너리 파일은 데이터를 읽을 때 명령어 형태로 읽는 개념이 아니라 단순하게 n 바이트를 읽어라 개념이다.
- 이미지, 동영상 파일이 바이너리로 저장되어 영상 전용 프로그램으로 이미지, 영상으로 보여 준다.
- 이진파일은 컴퓨터 프로그램이 읽는 데이터 파일
텍스트(Text) 파일
- 문자열 집합으로부터 문자를 기반으로 저장 된 파일
- 일반적으로 텍스트 파일을 메모장이나 텍스트 편집기로 열면 텍스트를 보게 된다.
- 문자열 집합으로는 ASCII 문자열 집합과 유니코드 문자열 등 집합이 있으며 텍스트 파일은 ASCII, 유니코드 등으로 인코딩하여 표현 저장된다.
- A~Z, 0~9, !@#$ 특수문자, 한글 등 사람이 눈으로 직접 읽을 수 있는 문자로 저장 된 데이터 파일
[참고]
- https://ko.wikipedia.org/wiki/비트_(단위)
- https://hsm-edu-math.tistory.com/409
- https://m.blog.naver.com/PostView.nhn?blogId=tipsware&logNo=221353023593&proxyReferer=https:%2F%2Fwww.google.com%2F