1. 프로그램 개론

   1) 주요 용어

      -1 프로그램  :  컴퓨터에게 전달할 명령어의 집합체 (정의된 문제해결)

      -2 프로그래밍  :  프로그램을 만드는 작업

      -3 프로그래밍 언어  :  프로그램을 만들 떄 사용하는 언어

      -4 프로그래머  :  프로그램을 만드는 사람

 

   2) 프로그램의 구성 요소

      -1 명령어  :  특정 결과가 나오기를 기대하거나, 특정 문제를 해결하기 위한 컴퓨터가 실행할 동작

                           필수로 작성되어야 하지만, 생략 가능함

      -2 데이터  :  명령어를 실행할 때 필요한 정보 (상수, 변수)

                          데이터를 필요로 하지 않는 명령어가 있음

      -3 주석  :  프로그램을 설명하는 비실행 문장 (옵션)

 

   3) 프로그램의 실행 종류

      -1 순차, 반복, 분기, 혼합

         (a) 순차  :  프로그램의 거의 대부분을 구성하는 단순 실행

         (b) 반복  :  for 또는 while 명령어를 이용하여 블록(명령)을 1회 이상 실행

         (c) 분기  :  if 명령어를 이용하여 블록(명령)의 실행을 결정

         (d) 혼합  :  순차, 반복, 분기를 혼합하여 실행

      -2 Case #1  :  순차1 -> 반복1

      -3 Case #2  :  순차1 -> 분기1

      -4 Case #3  :  순차1 -> 반복1 -> 분기1

      -5 Case #4  :  순차1 -> 분기1 -> 반복1

      -6 Case #5  :  ...

실행 종류 3가지를 무한하게 조립 가능  -->  프로그램

 

   4) 데이터와 변수

      -1 데이터

         (a) 수치형  :  정수, 실수

         (b) 문자형  :  문자

 

      -2 변수

         (a) 데이터가 저장된 공간을 가지는 문자

         (b) 이해를 쉽게 하기 위하여 "변수 = 데이터"로 생각

 

      -3 파이썬의 데이터(변수)

         (a) 리스트형  :  1개 이상의 수치형, 문자형, 리스트형, 딕셔너리형 등 다양한 데이터를 가지는 데이터 또는 변수

         (b) 튜플형  :  리스트형과 도일한 조건 + 데이터 변경 불가

         (c) 딕셔너리형  :  "key: value" 쌍으로 구성된 데이터 또는 변수. 이때 value는 데이터이다

 

      -4 시퀀스형  :  문자형, 리스트형, 튜플형 등

 

      -5 특정 패키지에서 사용하는 전용 데이터와 변수

         (a) pandas 패키지  :  dataframe(스프레드쉬트 형식의 2차원 데이터 표현), series(dataframe을 구성하는 1차원

                                           벡터 데이터)

         (b) numpy 패키지  :  array (1차원 이상의 데이터를 표현)

 

   5) 프로그램의 독해(IPO)

      -1 프로그램 실행은 반드시 목적이 있음

      -2 목적을 설명할 때 IPO로 설명하고 이해하면 됨

         (a) I  :  input

         (b) P  :  process

         (c) O   :  output

      -3 프로그램은 컴퓨터와 인간 사이의 언어로 만들었지만, 프로그램을 만드는 주체가 인간이기 때문에 인간이

          사용하는 자연어의 다른 표현이다. 즉 프로그램의 독해는 자연어로의 해석이다

      -4 프로그램 독해시 인간이 생각하는 관점에서 해석하려고 노력하면 독해의 어려움이 일부 해소된다

   6) 프로그램의 이해 어려움

      -1 익숙하지 않은 문제 인식과 논리적 접근 (수학적, 통계학적 접근)

      -2 배우는 과정에서 제공되는 프로그램이 완성된 코드로 제시되기 때문

         (a) 완성된 전체 프로그램은 미세한 작은 단위 문제를 해결하는 프로그램의 집합으로 전체 프로그램이 만들어진다

 

 

2. 기초 프로그램

   1) import와 pandas, numpy 패키지

      -1 import  :  어떤 기능을 수행하는 미리 만들어진 프로그램을 사용하기 위한 명령 (패키지 로드 명령)

      -2 pandas 패키지  :  데이터 관리 패키지

      -3 numpy 패키지  :  수치 연산 패키지

 

   2) 문제상황과 해결

      -1 문제가 있어야만 프로그램이 가능 (프로그램 대상)

       -2 문제를 논리적으로 정의할 수 있어야만 프로그램이 가능 (문제를 해석하는 시각)

 

   3) 문제해결 - 파일 접근과 열 데이터 선택

 

   4) 문제해결 - 행 데이터 선택과 삭제

 

 

   5) 문제해결 - 행 데이터 선태과 삭제

 

 

   6) 문제해결 - 행, 열 데이터 선택과 수정

 

   7) 문제해결 - 열 데이터 생성

 

 

   8) 시각화 (1개 데이터 수치형, 범주형)

 

 

   9) 시각화 (2개 데이터 수치형)

 

   10) 머신러닝 패키지 (scikit-learn) - 정수형 인코딩

 

    11) 머신러닝 패키지 (scikit-learn) - OneHot 인코딩

 

   12) 머신러닝 패키지 (scikit-learn) - LinearRegression(선형회귀)

 

 

   13) 머신러닝 패키지 (scikit-learn) - Decision TreeRegressor (의사결정트리)

 

   14) 머신러닝 패키지 (scikit-learn) - Decision TreeClassifier (의사결정트리)

'핀테크 인공지능' 카테고리의 다른 글

데이터 유형별 전처리 (정형)  (0) 2024.09.14
데이터 수집과 전처리  (4) 2024.09.14
인공지능 개발 환경  (2) 2024.09.14
기초 데이터 분석  (5) 2024.09.13
딥러닝  (2) 2024.09.13

+ Recent posts