Presto
Apache Drill과 개념적으로는 유사하지만 인상적인(?) 기술
- Drill처럼 다양한 데이터소스에 연결할 수 있고, 데이터소스에 SQl 쿼리를 할 수 있게 기능을 제공해줌.
- 만약 여러 대의 데이터 스토어가 있고, 각 데이터 스토어가 수평적으로 확장할 수 있다면, Presto로 단일 접근 지점을 만들 수 있음.
- Drill처럼 다양한 데이터베이스에 걸쳐서 쿼리를 날릴 수 있고, 각 데이터스토어에 있는 DB들을 JOIN할 수 있음. → 이게 진짜 대박이긴합니다.
- JDBC 드라이버를 제공하기 때문에 기존 애플리케이션에서 Presto에 연결하는 방법이 굉장히 단순함!! → 이것도 맞습니다.
다만!!
- OLAP 쿼리에 최적화된 녀석이다. Phoenix처럼 OLTP용이 아님. 신속한 트랜잭션을 제공할 수 없음. ‘데이터 분석', ‘데이터 웨어하우스 애플리케이션'을 위한 녀석.
- 높은 처리율이 필요하거나 지연시간을 낮추기 위해 사용하는 쿼리엔진이 아님. 복잡한 쿼리를 할 땐 굉장히 효율적이지만, 적어도 몇 초는 기다려야 함. ms, us가 아님..
- Apache Drill 대비 Presto를 사용해야 하는 이유는?
- Cassandra Connector 등이 있어서!라는데.. 그게 이윤가..
- 페이스북에서 매일 1000명 이상의 직원이 300 PB 이상의 3만 건이 넘는 쿼리를 쓰는 데이터 인프라의 핵심이라고 함.
- Airbnb와 Dropbox에서도 쓰이고 있음.
내용이 굉장히 짧네…