Giới thiệu Spark MLLib Association Rules

Giới thiệu Spark MLLib Association Rules

1. MLLib Là một thư viện hữu ích của Apache Spark về Machine Learning. Một số ưu điểm của Spark Nhanh hơn Hadoop MapReduce: dùng memory là 100x lần, dùng disk là 10x lần Dễ dàng sử dụng với Java (7+), Scala (Spark 1.6.1 dùng Scala 2.10), Python (2.6+), R (3.1+) Cung cấp nhiều thư viện: Spark SQL, Spark Streaming, MLLib, GraphX Có thể chạy Spark Standalone mode (https://spark.apache.org/docs/latest/spark-standalone.html) Trên EC2 (Amazon Elastic Compute Cloud – Môi trường điện toán đám mây do Amazon cung cấp) Trên Hadoop (là ... »

Tìm hiểu về Implicit trong Scala

Tìm hiểu về Implicit trong Scala

Với nhiều bạn mới tìm hiểu về Scala thì đọc code trong một số thư viện hoặc chương trình opensource thì sẽ thấy xuất hiện rất nhiều keyword implicit. Vậy implicit là gì, đóng vai trò gì trong ngôn ngữ Scala. Chúng ta hãy cùng điểm qua 2 khái niệm implicit thông dụng và thường gặp nhất trong Scala 1. Implicit parameter Chúng ta hãy cùng thử xem xét đoạn code sau: def payLoan(amount: Float)(implicit interestRate: Float): Float = amount + amount * interestRate payLoan(2201100)(3.0F) // Success payLoan(2201100) // Will cause error Ai cũng dễ dàng đoán được là ... »

Tạo một ứng dụng đơn giản với Twilio

Tạo một ứng dụng đơn giản với Twilio

I) Giới thiệu về Twilio Twilio là dịch vụ cho phép bạn xây dựng ứng dụng liên quan đến việc gửi và nhận các tin nhắn và cuộc gọi trên điện thoại. Trong bài viết này, mình sẽ tạo ra một ứng dụng trả lời điện thoại tự động đơn giản với Twilio. Để bắt đầu, chúng ta cần đăng ký một tài khoản trên trang chủ Twilio. Sau khi đăng ký được tài khoản, bạn có thể đăng ký số điện thoại cho ứng dụng của mình. Vời tài khoản dùng thử miễn phỉ, bạn chỉ được sử dụng ... »

PHP 7 - Tìm hiểu những điểm mới trong PHP7 và cách cài đặt

PHP 7 - Tìm hiểu những điểm mới trong PHP7 và cách cài đặt

PHP – Một ngôn ngữ lập trình phổ biến nhất trên thế giới, gần đây đã phát hành phiên bản PHP 7. Chúng ta hãy cùng tìm hiểu PHP version 7 có gì mới mẻ so với phiên bản stable mà hiện nay chúng ta đang sử dụng –  phiên bản 5.6. PHP 6 – là một dự án thử nghiệm, nhưng vì một số lý do nào đó mà nó chưa hoàn chỉnh, để người dùng tránh việc nhầm lẫn giữa các version thử nghiệm và hoàn chỉnh. Vì vậy, PHP 7 đã ra đời. Phiên bản alpha đầu tiên được ... »

Giới thiệu ReactJs

Giới thiệu ReactJs

**ReactJs là gì ? ** ReactJS là một Javascript library được phát triển bởi Facebook đang ngày càng trở nên phổ biến hơn. ReactJS có thể hiểu như là một “cơ chế hiển thị giao diện dựa trên nền tảng Javascript – JavaScript-based UI rendering engine”. React thường được so sánh với vai trò tương đương như các Javascript framework khác, nhưng việc so sánh giữa React và Angular thực sự không có ý nghĩa, bởi chúng sinh ra để đảm nhiệm những vai trò khác nhau. Angular là một framework hoàn chỉnh còn React thì không. Điều này lý giải tại sao ... »

Sử dụng git-flow để tự động hóa workflow

Sử dụng git-flow để tự động hóa workflow

Trong bài viết trước về giới thiệu git, chúng ta đã được thấy một trong những workflow cho git rất hiệu quả để tracking các feature, hotfix hay release branch cho dự án. Đây chính là workflow của anh Vincent Driessen với bài viết A successful Git branching model rất chi tiết. Tuy nhiên, với việc phải nhớ khá nhiều lệnh để hiện thực hóa, nhất là khi có nhân sự mới chưa biết nhiều về workflow này thì việc hướng dẫn khá mất thời gian và dễ gây sai sót. Chính vì thế Vincent Driessen đã xây dựng một ... »

Một vài best practice khi tunning Spark

Một vài best practice khi tunning Spark

1. Lựa chọn RDD Operation thích hợp RDD hỗ trợ 2 loại operation: transformation và action. Khi kết hợp các transformation và action khác nhau, có thể cho cùng một kết quả. Tuy nhiên hiệu năng của chúng lại khác nhau, nên việc lựa chọn operation một cách thích hợp có thể cải thiện hiệu năng của chương trình. Sử dụng reduceByKey hoặc aggregateByKey sẽ cho hiệu năng tốt hơn groupByKey Ví dụ với bài toán đếm từ, sau đây là 2 cách dùng groupByKey và reduceByKey val words = Array("one", "two", "two", " ... »

Tóm tắt sách ”Team Geek: A Software Developer's Guide to Working Well with Others”

Tóm tắt sách ”Team Geek: A Software Developer's Guide to Working Well with Others”

Qua truyền thông, mọi người đều biết đến những huyền thoại trong giới công nghệ thông tin như Linus Torvalds hay Bill Gates. Nhưng những phầm mềm gắn liên với tên tuổi họ là Linux và Windows đều được tạo ra từ công sức của rất nhiều lập trình viên khác nhau. Những ngôi sao nổi tiếng như Lionel Messi hay Micheal Jordan cũng vậy, họ không chơi bóng một mình. Lập trình phần mềm là một môn thể thao đồng đội mà đa phần người tham gia – những lập trình viên – đều không phải là thiên tài. Nhiệm vụ ... »