본문 바로가기 메뉴 바로가기

시행착오와 배움을 기록하는 공간

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

시행착오와 배움을 기록하는 공간

검색하기 폼
  • 분류 전체보기 (76)
    • ALL (73)
      • Java (4)
      • Kotlin (1)
      • Spring (9)
      • Spring Boot (6)
      • JPA (0)
      • Javascript (7)
      • Node.js (1)
      • React (5)
      • 에러로그 (3)
      • 네트워킹(Networking) (2)
      • 인프라 (3)
      • Linux (1)
      • 데이터모델링 (2)
      • Database (10)
      • Data (2)
      • Python (0)
      • Hadoop (0)
      • PySpark (0)
      • DataPipeline (0)
      • 활동 (1)
  • 방명록

Spark (2)
Databricks 스파크 시작(내용무)

Databricks - Sign In community.cloud.databricks.com 노트북 생성하고, 클러스터 생성 완료 kaggle 사이트 접속, 로그인 후 데이터 내려받기

카테고리 없음 2024. 3. 26. 15:56
PostgreSQL, SparkSQL

PostgreSQL PostgreSQL은 오픈소스 RDB(Relational Database)이다. MySQL 등 다른 오픈소스 RDB와 비교하면 PostgreSQL은 표준 SQL을 잘 준수하며, 윈도우함수, CTE(WITH구문) 등 분석에 필수적으로 사용하는 구문 등을 모두 구현한다. Apache Hive PostgreSQL등의 RDB에서 대량의 데이터를 처리할 때 디스크에서 보틀넥이 발생하게 된다. 디스크 I/O가 보틀넥이 되는 경우 고속으로 데이터를 처리하기 위한 아키텍처로 분산 파일 시스템이 고안되었다. 분산 파일 시스템을 사용하면 거대한 데이터를 작게 분할해서 여러 개의 디스크에 분산해서 저장하고 각 디스크에서 동시에 데이터를 읽어 들여 고속으로 대량의 데이터를 처리할 수 있게 된다. Apach..

ALL/Data 2023. 7. 21. 15:54
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
  • 데브캠프
  • SQL
  • React
  • JavaScript
  • 코드로 배우는 스프링 웹 프로젝트
  • Node.js
  • MySQL
  • 스프링
  • node
  • spring
  • Spark
  • AWS
  • 인덱스
  • Oracle
  • 시큐리티
  • 자바의정석
  • 친절한SQL튜닝
  • 데이터베이스
  • 멀티스레딩
  • 스프링의정석
  • 한입크기로 잘라먹는 리액트
  • @Configuration
  • 스프링 빈
  • 리액트
  • EC2
  • 스프링 프로젝트
  • 옵티마이저
  • 자바스크립트
  • 이정환
  • 남궁성
more
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바