Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- 연남 맛집
- yolo
- 위기의코딩맨
- Transformer
- TensorFlow
- 부스트캠프 ai tech 준비과정
- AI Tech 준비과정
- DataSet
- spark
- 자연어
- AI 엔지니어 기초 다지기
- AI tech
- 연남동 맛집
- RDD
- 서울 맛집
- NLP
- pycharm
- r
- 부스트캠프
- Python
- Spark MLlib
- 부스트클래스
- 데이터 시각화
- mllib
- tensorflow 예제
- 홍대 맛집
- Ai
- kaggle
- 캐글
- 맛집
Archives
- Today
- Total
반응형
목록repartition (1)
반응형
We-Co
[We-Co] Spark RDD PIPE 및 파티션 연산
안녕하세요. 위기의 코딩맨입니다. 오늘은 Spark RDD PIP 및 파티션 연산에 대해 알아보도록 하겠습니다. [ pipe() ] 데이터를 처리할 때 외부 프로세스를 사용할 수 있습니다. val rdd = sc.parallelize(List("1,2,3","4,5,6","7,8,9")) val result = rdd.pipe("cut -f 1,3 -d,") print(result.collect.mkString(", ")) 결과는 1,3 4,6 7,9 의 결과를 얻을 수 있습니다. 해당 건은 3개 숫자의 문자열을 리눅스의 cut 유틸리티를 이용해 분리하고 1, 3번째 숫자를 가져오는 예제입니다. [ coalesce(), repartition() ] RDD를 생성하고, filter() 연산 등, 많은 트랜..
Spark
2021. 8. 27. 12:19