목록프로그래밍/데이터 분석 (4)
이것도 알아야 하네?
사용할 일은 자주 있지만, 그럴 때마다 항상 찾아보면서 사용하는 기능들 — Lambda, filter, reduce, and map 해당 기능들은 Python에서 짧고 간결한 코드로 작성할 수 있도록 도움을 제공합니다. 더이상 찾지않아도 되도록 오늘 외우기 위해 정리해봅니다,, ■ lambda lambda 함수는 간단하게 생각하면 복잡하지 않은 함수를 생성할 수 있는 기능을 제공하며 함수를 이름없이 사용할 수도 있습니다. 주로 한 번 사용을 위해 사용되며, 앞에서 언급된 다른 함수들 — filter, reduce, map들과 함께 사용되며, 복잡하지 않은 함수를 생성하기 때문에 syntax는 비교적 간단합니다. syntax lambda [argument_list]: [연산] 예시 sqrt = lambda..
csv 파일이란? csv 파일이란 comma separated values 의 약자로 데이터를 저장하는 파일 형식 중 하나입니다. 이름에서 예측할 수 있듯이 record에 저장되는 값들이 ',(comma)'를 이용하여 나열되어 있습니다. csv파일 읽기 csv파일도 파일형식이기 때문에 (1) open() 구문을 사용하여 일반 파일처럼 읽고 쓸 수 있고, 추가로 Python에서는 (2) csv 파일을 처리할 수 있는 기능을 가진 모듈을 built-in으로 제공하기 때문에 해당 모듈을 사용하여 더욱 쉽고 직관적으로 csv 파일을 조작할 수 있습니다. // test.csv 내용 a,b,c 1,2,3 4,5,6 (1) open() 사용하기 f = open(file_name) ... f.close() 파일을 읽을..
취업했을 당시에 회사를 다니더라도 나 == 회사가 되지 않도록 1년에 1자격증을 다짐했었고, 올해의 도전은 회사에서 하는 일과 관련있는 정보처리기사를 도전하였습니다. '코로나 시대'라는 불확실한 상황에서 시험을 아예 못칠 뻔도 했지만, 운이 좋게도 잠깐 좋았졌던 때를 틈타 취득할 수 있었습니다. 늦었지만, 2020년도에 시험을 본 경험으로, 정보처리기사에 대한 소개 및 사용한 교재를 포함한 공부 방법과 준비 기간을 공유하고자 후기를 작성합니다 정보처리기사 정보처리기사는 코로나 전에는 일년에 4번의 시험이 존재하며 다른 기사 시험과 동일하게 필기와 실기를 모두 합격해야지만 자격증을 취득할 수 있습니다. 동일 회차를 가정했을 떄 필기와 실기는 1달 정도의 term이 존재하고, 실기를 보기 위해서는 응시 자격..
클래스 간 데이터 양 차이가 큰 경우 클래스 불균형이 있다고 말한다. 불균형 데이터의 문제점 데이터 클래스의 비율이 너무 차이나면 단순히 majority 클래스를 택하는 모형의 정확도가 높아지므로 모형의 성능 판별이 어려워진다. 즉, 정확도(accuracy)가 높아도 데이터 개수가 적은 클래스의 재현율(recall)가 급격히 작아지는 현상이 발생할 수 있다. 때문에 이런 상황에서는 정확도 외의 다른 지표들을 확인할 필요가 있다. 실제 값 (정답) 참 (Positive) 거짓 (Negative) 예측 값 참 (Positive) TP (True Positive) FP (False Positive) 거짓 (Negative) FN (False Negative) TN (True Negative) 정확도는 맞은 개..