0번째 칼럼에 'target'칼럼을 0값으로 채움 data.describe() data.info() data.isnull().sum() data.groupby('target').agg(['mean','median']) 출제자: 조준희 출제 의도: csv파일을 부르는 방법을 습득한다. 결측치, 기술통계량, 정보를 출력할 수 있는지를 확인하고 groupby agg함수를 사용해본다. ''' #이론 ''' 1. X axis=1 이여야함, axis=0은 각 열의 값임 출제자: 김시현 출제 의도: apply()함수의 사용 방법을 숙지하고 있는지 확인한다. 2. False. nan은 값이나 순서를 가지지 않기 때문에 '!='을 제외한 연산에는 항상 false를 반환 출제자: 전홍규 출제 의도: NaN에 대한 기초적인 이해를 확인한다. 3. keep = '-' 이라는 패러미터를 이용한다. // 'first, last 를 활용한다'도 답 인정. 출제자: 전홍규 출제 의도: 강의에서 설명한 함수에 대한 기본적인 이해를 묻는다. 4. X 기본적으로 내림차순으로 정렬한다. 출제자 : 전지원 출제 의도 : 함수에 대한 기본적인 내용을 숙지하고 있는지 확인한다. 5. O 복합조건을 만족하는 행을 가져오려면 각 조건을 괄호로 필수적으로 구분을 해주어야 하며, 연산기호 대신 and, or등을 사용하면 오류가 발생한다. '''"> 0번째 칼럼에 'target'칼럼을 0값으로 채움 data.describe() data.info() data.isnull().sum() data.groupby('target').agg(['mean','median']) 출제자: 조준희 출제 의도: csv파일을 부르는 방법을 습득한다. 결측치, 기술통계량, 정보를 출력할 수 있는지를 확인하고 groupby agg함수를 사용해본다. ''' #이론 ''' 1. X axis=1 이여야함, axis=0은 각 열의 값임 출제자: 김시현 출제 의도: apply()함수의 사용 방법을 숙지하고 있는지 확인한다. 2. False. nan은 값이나 순서를 가지지 않기 때문에 '!='을 제외한 연산에는 항상 false를 반환 출제자: 전홍규 출제 의도: NaN에 대한 기초적인 이해를 확인한다. 3. keep = '-' 이라는 패러미터를 이용한다. // 'first, last 를 활용한다'도 답 인정. 출제자: 전홍규 출제 의도: 강의에서 설명한 함수에 대한 기본적인 이해를 묻는다. 4. X 기본적으로 내림차순으로 정렬한다. 출제자 : 전지원 출제 의도 : 함수에 대한 기본적인 내용을 숙지하고 있는지 확인한다. 5. O 복합조건을 만족하는 행을 가져오려면 각 조건을 괄호로 필수적으로 구분을 해주어야 하며, 연산기호 대신 and, or등을 사용하면 오류가 발생한다. '''"> 0번째 칼럼에 'target'칼럼을 0값으로 채움 data.describe() data.info() data.isnull().sum() data.groupby('target').agg(['mean','median']) 출제자: 조준희 출제 의도: csv파일을 부르는 방법을 습득한다. 결측치, 기술통계량, 정보를 출력할 수 있는지를 확인하고 groupby agg함수를 사용해본다. ''' #이론 ''' 1. X axis=1 이여야함, axis=0은 각 열의 값임 출제자: 김시현 출제 의도: apply()함수의 사용 방법을 숙지하고 있는지 확인한다. 2. False. nan은 값이나 순서를 가지지 않기 때문에 '!='을 제외한 연산에는 항상 false를 반환 출제자: 전홍규 출제 의도: NaN에 대한 기초적인 이해를 확인한다. 3. keep = '-' 이라는 패러미터를 이용한다. // 'first, last 를 활용한다'도 답 인정. 출제자: 전홍규 출제 의도: 강의에서 설명한 함수에 대한 기본적인 이해를 묻는다. 4. X 기본적으로 내림차순으로 정렬한다. 출제자 : 전지원 출제 의도 : 함수에 대한 기본적인 내용을 숙지하고 있는지 확인한다. 5. O 복합조건을 만족하는 행을 가져오려면 각 조건을 괄호로 필수적으로 구분을 해주어야 하며, 연산기호 대신 and, or등을 사용하면 오류가 발생한다. '''">
#답안
#실습
'''
import pandas as pd
data=pd.read_csv("/content/Iris.csv") #csv 파일을 불러온 후 데이터프레임으로 변환
data.head()
data.insert(6,'target',0) #groupby를 이용하기 위해 target 칼럼을 추가 -> 0번째 칼럼에 'target'칼럼을 0값으로 채움
data.describe()
data.info()
data.isnull().sum()
data.groupby('target').agg(['mean','median'])
출제자: 조준희
출제 의도: csv파일을 부르는 방법을 습득한다.
결측치, 기술통계량, 정보를 출력할 수 있는지를 확인하고 groupby agg함수를 사용해본다.
'''
#이론
'''
1. X
axis=1 이여야함, axis=0은 각 열의 값임
출제자: 김시현
출제 의도: apply()함수의 사용 방법을 숙지하고 있는지 확인한다.
2. False.
nan은 값이나 순서를 가지지 않기 때문에 '!='을 제외한 연산에는 항상 false를 반환
출제자: 전홍규
출제 의도: NaN에 대한 기초적인 이해를 확인한다.
3. keep = '-' 이라는 패러미터를 이용한다. // 'first, last 를 활용한다'도 답 인정.
출제자: 전홍규
출제 의도: 강의에서 설명한 함수에 대한 기본적인 이해를 묻는다.
4. X
기본적으로 내림차순으로 정렬한다.
출제자 : 전지원
출제 의도 : 함수에 대한 기본적인 내용을 숙지하고 있는지 확인한다.
5. O
복합조건을 만족하는 행을 가져오려면 각 조건을 괄호로 필수적으로 구분을 해주어야 하며,
연산기호 대신 and, or등을 사용하면 오류가 발생한다.
'''
A. 아래의 링크에서 iris 데이터를 다운로드 한 후, 코랩 파일에서 csv파일을 불러오기 (3점)
데이터셋 https://www.kaggle.com/datasets/uciml/iris?select=Iris.csv
B. Iris 데이터셋에 ‘target’ 이름의 칼럼을 추가 (2점)
C. Iris 데이터셋의 정보확인(각 칼럼의 정보, 데이터타입, 기술통계량, 결측치 등) (2점)
D. ‘target 컬럼으로 그룹화를 한 후, 여러가지 연산을 가능하게 해 주는 ‘agg함수’를 이용하여 ‘mean’과 ‘median’을 연산 (3점)
import pandas as pd
data=pd.read_csv("/content/Iris.csv") #csv 파일을 불러온 후 데이터프레임으로 변환
data.head()
data.insert(6,'target',0) #groupby를 이용하기 위해 target 칼럼을 추가 -> 0번째 칼럼에 'target'칼럼을 0값으로 채움
data.describe()
data.info()
data.isnull().sum()
data.groupby('target').agg(['mean','median'])
#출제자 조준희
#출제 의도: csv파일을 부르는 방법을 습득한다.
#결측치, 기술통계량, 정보를 출력할 수 있는지를 확인하고 groupby agg함수를 사용해본다.
#Apply 함수
df[introduce]= df.apply(get_introduce, axis=0) 은 df의 introduce의 각 행의 값에
get_introduce함수를 적용하는 코드이다.
---> X , (axis=1 이여야함 , axis=0은 각 열의 값임)
출제자: 김시현
출제 의도: apply()함수의 사용 방법을 숙지하고 있는지 확인한다.
#NaN 기초
'''
x=float('nan')
print(x==x)
'''
#결과값과 그 이유를 작성하시오.
#A: False. nan은 값이나 순서를 가지지 않기 때문에 '!='을 제외한 연산에는 항상 false를 반환
#출제자: 전홍규
#출제 의도: NaN에 대한 기초적인 이해를 확인한다.
#중복 데이터 삭제
#중복된 데이터를 삭제 할 때
'''
df.drop_duplicate()
'''
#라는 함수를 사용한다고 하자.
#어떤 패러미터를 이용하여야 유지시킬 데이터를 결정 할 수 있는가?
#A: keep = '-' 이라는 패러미터를 이용한다. // 'first, last 를 활용한다'도 답 인정.
#출제자: 전홍규
#출제 의도: 강의에서 설명한 함수에 대한 기본적인 이해를 묻는다.
#unique, value_counts
value_counts()는 기본적으로 데이터의 개수를 오름차순으로 정렬해준다. (O,X)
#A: X (기본적으로 내림차순으로 정렬한다.)
#출제자 : 전지원
#출제 의도 : 함수에 대한 기본적인 내용을 숙지하고 있는지 확인한다.