전체 글 (19) 썸네일형 리스트형 tidyr:: (1) reshape function: gather, spread [참고 페이지] https://m.blog.naver.com/bosongmoon/221587219214 https://gomguard.tistory.com/22 지금 설명할 것은, 'Reshape data: change the layout of values in a table'에 관련된 두 함수다. Reshape Data 1. gather(data, key, value, ..., na.rm = F, convert = F, factor_key = F) table4a %>% gather('1999', '2000', key='year', value='cases') 또는, gather(table4a, '1999', '2000', key='year', value='cases') = columns: 1999, 20.. 'tidyverse' package 여담: 아주 오랜만에 티스토리글을 쓴다... 완전 잊었음... 그치만 예상했다 작심삼일 - 사라 = 0 이니깐 아무튼 각설하고 tidy 패키지를 정리해야할 것 같아 들고왔다 내가 정말 필요로 했던 기능도 발견했기 때문! (이건 tidyr로 ㄱㄱ) 0. Tidy data란? Hadley Wickham(2016)에 따르면 tidy data는 아래 세 가지 규칙을 갖는다고 합니다. 하나의 변수는 하나의 세로줄을 형성한다. (Each variable forms a column: Variables in columns) 하나의 관측치는 하나의 가로줄을 형성한다. (Each observation forms a row: observations in rows) 하나의 변수의 종류별로 하나의 표를 형성한다. (Each t.. NUMPY :: np.random (2) 잊고 있었다... 요즘 아침시간을 공치며 날리는 기분ㅠㅅㅠ 소홀해지지 말자. ㅠㅠ 지난 시간에 random의 대표적인 난수생성 함수의 rand, randn, randint를 다뤘었다. 이번엔 난수 생성은 아니나 앞의 세 함수만큼 자주 쓰이는 함수들을 다뤄보겠다. 오늘 사라가 다룰 함수: choice shuffle permutation np.random.choice 데이터 샘플링 함수 난수생성 함수처럼 정수를 샘플링할 수 있다. 또한 그 자리에 배열을 삽입하면, 배열을 모집단으로 하여 표본추출이 가능하다. argument는 prob를 의미하는 p, 복원/비복원을 결정하는 replace(True가 디폴트)가 있다. 우선 정수를 샘플링하는 법을 보자. 너무 쉬우니 설명보단 파이썬 코드로 대체하겠다. 이번엔 모.. NUMPY :: np.random (1) 오늘은 아침에 할 일이 있어서 최대한 빨리 적어보도록 하겠다. 함수들을 배울 때마다 매번 블로거분들이 이 numpy.random을 이용하여 예제 데이터를 만들었다. 그때마다 random 함수가 이렇게 요긴하게 쓰인다고? 했는데, 오늘 제대로 배워보도록 하자. 대표 3대장: rand randn randint 이 세 개가 random을 이야기했을 때 가장 많이 등장하는 함수다. 각각의 역할을 알아보자. 뒤로는 편의를 위해 numpy as np를 사용한다. np.random.rand 0~1 사이의 균일분포 값을 반환. 이처럼 rand 함수는 균일분포에서 여러 난수를 추출할 수 있다. 심지어 다차원도 가능! np.random.randn 표준정규분포(standard normal distribution)에서 난수를.. 이전 1 2 3 4 5 다음 목록 더보기