[Java] FILE - 바이너리(Binary) 파일과 텍스트(Text) 파일 포스팅


컴퓨터의 파일에는 크게 2종류로 바이너리 파일(이진파일)텍스트파일이다.
카테고리가 java는 아니지만 java 개발 하다 작성하니. 하여튼 바이너리 파일과 텍스트 파일과 간단하게 비트와 바이트 설명에 대한 포스팅이다.



비트(Bit, binary digit)

  • BInary(이진법의) digiT(숫자) = bit
  • 하나의 비트는 0이나 1의 값을 가질 수 있고
  • 컴퓨터의 가장 작은 단위
  • 데이터를 처리, 저장, 전송 할 때 사용
  • 정보의 기본단위 ‘바이트(Byte)’



바이트(Byte)

  • 데이터 파일의 크기
  • 디스크 또는 그 외 저장 매체의 공간
  • 네트워크를 통하여 전송 되는 데이터의 양을 표현하는데 사용 되는 측정 단위
  • 1바이트는 8비트 (1Byte = 8bit) 와 같다.
  • CPU가 이해할 수 있는 언어가 바이너리 코드라면 바이트 코드는 가상 머신이 이해할 수 언어이다.


바이트 코드 예

  • java에서는 컴파일러(javac)에 의해 소스파일(.java) > 목적파일(.class)로 변환될 때 컴퓨터가 바로 인식할 수 있는 바이너리코드가 아닌 바이트 코드로 변환



바이너리 파일(Binary, 이진 파일)

바이너리(Binary, 2진수) 코드

  • 컴퓨터가 인식할 수 있는 0과 1로 구성된 이진코드



바이너리 파일

  • 0과 1로 이루어진 코드로 변환. 즉, 컴파일 후에 이미 컴퓨터가 이해할 수 있는 이진코드로 변환된 것
  • 우리가 많이 사용하는 이미지 파일(.jpg), 음악파일(.mp3), 실행 파일(.exe), 텍스트 파일(.txt)등이 바이너리 파일에 해당된다. 즉 바이너리 파일은 데이터를 읽을 때 명령어 형태로 읽는 개념이 아니라 단순하게 n 바이트를 읽어라 개념이다.
  • 이미지, 동영상 파일이 바이너리로 저장되어 영상 전용 프로그램으로 이미지, 영상으로 보여 준다.
  • 이진파일은 컴퓨터 프로그램이 읽는 데이터 파일



텍스트(Text) 파일

  • 문자열 집합으로부터 문자를 기반으로 저장 된 파일
  • 일반적으로 텍스트 파일을 메모장이나 텍스트 편집기로 열면 텍스트를 보게 된다.
  • 문자열 집합으로는 ASCII 문자열 집합과 유니코드 문자열 등 집합이 있으며 텍스트 파일은 ASCII, 유니코드 등으로 인코딩하여 표현 저장된다.
  • A~Z, 0~9, !@#$ 특수문자, 한글 등 사람이 눈으로 직접 읽을 수 있는 문자로 저장 된 데이터 파일




[참고]

  • https://ko.wikipedia.org/wiki/비트_(단위)
  • https://hsm-edu-math.tistory.com/409
  • https://m.blog.naver.com/PostView.nhn?blogId=tipsware&logNo=221353023593&proxyReferer=https:%2F%2Fwww.google.com%2F