일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- Transformer
- DataSet
- 부스트클래스
- 위기의코딩맨
- spark
- NLP
- yolo
- RDD
- 부스트캠프
- pycharm
- 맛집
- AI 엔지니어 기초 다지기
- kaggle
- AI Tech 준비과정
- 자연어
- Spark MLlib
- 연남동 맛집
- 부스트캠프 ai tech 준비과정
- TensorFlow
- r
- 데이터 시각화
- mllib
- Ai
- 홍대 맛집
- 캐글
- AI tech
- tensorflow 예제
- Python
- 서울 맛집
- 연남 맛집
- Today
- Total
목록2024/03 (13)
We-Co
안녕하세요. 위기의코딩맨입니다. 오늘은 시각화 작업을 진행하면서 자주 사용됐던 명령어를 한번 설명드리도록 하겠습니다. 저는 가장 많이 사용된게 NA 제외하는 방법(Null제외)과 어떠한 컬럼값 기준으로 정렬하는 방법, 그룹을 정하는 방법 3가지를 가장 많이 사용했던것 같습니다. 해당 방법을 천천히 알아보도록 하겠습니다. [ NA 제외 ] 먼저 NA 값을 제외하는 방법을 알아보도록 하겠습니다. 기본적으로 시각화를 진행하거나 평균을 설정할때, NA,이상치 값은 다양한 영향을 끼칩니다. 그래서 제외를 하거나 값을 변경해주는데 그 중, 제외하는 방법을 알아보도록 하겠습니다. 기본 예제 데이터프레임을 만들어서 출력해보면 아래 처럼 2번항목에 NA가 포함되어있는것을 확인할 수 있습니다. dataF % summari..
안녕하세요. 위기의 코딩맨입니다. 오늘은 R에서 워드클라우드를 제공하고 있는 것을 알게되어서 사용 방법을 간단하게 알아보도록 하겠습니다. 여기서 wordcloud란? 원하는 데이터 셋을 분석하여 중요도를 고려하여 문자를 시각적으로 표현한 방법이라고 생각하시면 됩니다. 아래의 이미지처럼 데이터 셋에서 자연어의 영역이 제일 중요도가 높은 것을 시각화 한 것을 예를 들 수 있습니다. 한글도 지원된다고하니 아주 유용하군요. [ wordcloud ] 먼저 해당 라이브러리를 설치해야합니다. 설치를 진행하고, wordcloud2를 불러오는 코드입니다. install.packages("wordcloud2") library(wordcloud2) 그리고 사용할 데이터 셋을 불러오도록 하겠습니다. 저는 R의 내장 데이터인 ..
안녕하세요. 위기의 코딩맨입니다. 오늘은 symbols 함수를 이용해서 데이터를 시각화 해보는 방법을 알아보도록 하겠습니다. 빠르게 알아보도록 하죠! [ symbols() ] 먼저 R의 내장된 데이터인 trees를 사용해보도록 하겠습니다. 미국에서 흑단나무 데이터를 저장해 놓은 것이라고 합니다. trees를 확인해보면, Girth(지름), Height(높이), Volume(볼륨)의 항목의 데이터를 확인할 수 있습니다. head(trees) 아래의 코드를 확인해 보겠습니다. 먼저, with() 함수는 데이터 프레임, 리스트 변수에 이름으로 접글 가능할 수 있도록 도움을 주는 함수입니다. 그 함수에 trees 데이터를 적용 합니다. 그리고 Height, Volume을 설정했습니다. 순서로 x, y 좌표에 적..
안녕하세요. 위기의코딩맨입니다. 오늘은 파이 모양을 갖고있는 파이차트를 알아보도록 하겠습니다. 파이차트는 원 그래프라고도 불리며, 데이터를 비율별로 원형으로 표현한 그래프로 생각하시면 됩니다. 바로 실습으로 들어가보시죠! [ pie() ] 간단하게 파이 차트를 생성해보도록 하겠습니다. 1~12값을 생성하고, 색상을 레인보우 함수를 이용하여 12가지 색상을 설정합니다. 반지름을 0.7로 설정해서 생성해보겠습니다. pie(rep(1,12), col = rainbow(12), radius=0.7) 너무 색상이 쨍하니 뭔가 어렸을때 그렸던 그림같네요! 이제 샘플 데이터를 생성해서 적용하고 생성해보도록 하겠습니다. pie.data
안녕하세요. 위기의코딩맨입니다. 제 블로그에서 SOTA를 소개하고 확인하는 방법에 대해서 간단하게 설명한 포스팅이 있습니다. 그 포스팅이 꽤나 조회수가 나오더라구요. ㅎㅎ 궁금하신 분들은 아래 포스팅을 확인해주세요! [We-Co] SOTA - 이것이 무엇인고! 안녕하세요. 위기의 코딩맨입니다. 저번에 AI 모델 순위를 확인할 수 있는 사이트 papers with code 사용법에 대해서 소개해드렸는데요! 많이 사용되는 데이터셋의 순위, 해당 분야에서의 SOTA에 대해 we-co.tistory.com 그래서 오늘은 2024년 3월 기준, 현재 몇가지 분야가 있으며, 그 분야의 Best Model을 확인해보겠습니다. 그리고 SOTA 선정의 기준은 Dataset과 연구 목적에 따라 다르지만, 성능지표, 효율성..
안녕하세요. 위기의코딩맨입니다. 오늘은 간단하게 히스토그램에 대해서 알아보도록 하겠습니다. 히스토그램은 표 형식 데이터인 도수 분포를 그림 형태로 나타낸 것이라고 생각하시면 됩니다. 이론적으로는 이렇게 설명이 가능하지만 실습을 진행하며 친해져 보도록 합시다! [ hist() ] 바로 사용해보도록 합시다. 난수 생성을 위해서 set.seed를 설정해주고 평균 25, 표준편차 2인 정규분포를 따르는 1000개의 체질량지수 값을 생성합니다. 그 값을 hist() 함수에 적용하고 freq를 FALSE로 설정합니다. y축 기준으로 상대도수를 출력하게 됩니다. set.seed(100) BMI
안녕하세요. 위기의 코딩맨입니다. 오늘은 R을 통해서 점표도를 그려보도록 하겠습니다. 우선 dotchart()와 친해져보도록 하겠습니다. [ dotchart() ] 바로 사용해보도록 하겠습니다. 먼저 1~12월을 생성해서 날짜와 이름을 설정하고 dotchart를 통해서 그래프를 생성했습니다. month
안녕하세요. 위기의 코딩맨입니다.오늘은 개발과 일상에서 자주 사용하는 ChatGPT의 비교를 해보도록 하겠습니다.일단 궁금한거나 개발에서 오류나 코드를 확인할때 가끔 ChatGPT를 활용합니다. 기존에는 3.5 버전에서만 사용을 했지만 4.0에 대해서 궁금증이 생겨 비용을 지출하고 약 2달정도 사용한 후기를 작성해보려고합니다. 3.5보다 더 많은 데이터와 지식을 기반으로 학습을 진행하고, 더욱 복잡한 알고리즘이 사용되어 더 정확하고 대응 능력이 좋아졌다고합니다. 그리고 이미지에 관련해서 생성 및 분석이 가능하다고 합니다. 4.0은 데이터 기준은 2023년4월 기준까지 데이터를 학습했다고 합니다.그리고 한국어도 더 폭 넓게 사용가능하다고 합니다. 일반적인 차이는 찾아보면 이러한 얘기들을 찾아볼 수 ..