четвер, 26 лютого 2015 р.

Lviv Hadoop User Group meetup #3 REPORT

Lviv Hadoop user group meetup #3 Report

Минулого тижня львівське комюніті зібралося втретє щоб обмінятися досвідом в межах Hadoop компетенції. Аудиторія була люб"язно надана компанією Epam, яка прихистила нас в своєму тренінг центрі на забезпечила нескінченою кількістю смачних піц на напоїв (за що виносимо подяку HR віділу!).




Першим виступив спеціальний гість з київського Єпаму - Юрій Юрченко, який поділився своїм досвідом роботи з XML на петабайтному датасеті. Доповідь викликала масу запитань та жваве обговорення не тільки під час доповіді, а й після під час неформального спілкування.

Другим доповідачем був Максим Дорошено з львівського Єпаму, який виступив з доповідю на доволі екзотичну тему: Developing custom eXtensions for HUE. Для багатьох користувачів хадупу, можливість кастомізувати HUE та доповнювати веб-інтерфейс власними компонентами стала справжнім відкриттям. Загалом, кілька людей просто під час доповіді дійшли висновку, що їм на проекті потрібно також кастомізувати HUE під власні потреби.

Гарною традицією стало вручення подарунків найактивнішим учасникам: на це раз це були подарункові набори від Epam Systems та O'Reilly. Також бібліотека юзер групи поповнилася новими книжками від O'Reilly, які були представлені (і одразу роздані) під час зустрічі: загалом в нашій бібліотеці тепер є 5 книжок на теми BigData та споріднені.

Наприкінець, хотілося б ще раз подякувати Epam за чудову організацію івенту!

четвер, 19 лютого 2015 р.

Book Review: Natural Language Annotation for Machine Learning

Natural Language Annotation for Machine Learning

A Guide to Corpus-Building for Applications
Publisher: O'Reilly Media
Final Release Date: October 2012
Pages: 342



    Do you want to learn what is the Natural Language Annotation(NLP)? Do you want to learn how to prepare your own training corpus for machine learning? So, this book it is what you need! This book guides you step by step through full annotation development cycle. You also don't need any experience in this area. This book there are a lot of practice's 
examples which you will start using from first chapter till the end of the book. 

   It will be better, if you have experience with Python. You also can read the book "Natural Language Processing with Python" by Steven Bird, Ewan Klein, and Edward Loper(O'Reilly) which provides an excellent introduction into Python and to aspect of Natural Language Annotation (NLP).

   I recommend to read this book for all who decides to start learning NLP and Machine Learning and also who uses it and wants to learn how to create their own corpuses for Machine Learning.

вівторок, 10 лютого 2015 р.

Зустріч №3


Lviv Hadoop User Group Meetup #3

З радістю повідомляю, що компанія Epam погодилася надати аудиторію та піцу:) для проведення 3ї зустрічі нашого комюніті!

Отже, вже 19 лютого, о 19:00 запрошую всіх бажаючих на 3ю зустріч юзер групи за адресою львівського офісу Epam (вул. Олени Степанівни 45, 5й поверх - трейнінг центр). 

Заплановані теми доповідей:
  • Working with XML in Hadoop and Hive by Iurii Iurchenko from Epam Kyiv
  • Developing custom eXtensions for Hue by Maxim Doroshenko from Epam Lviv
  • Free talks and pizza
  • ... а також нові книжки від O"REILLY та подарунки найактивнішим учасникам від O"REILLY та EPAM Systems

Для відвідування заходу реєстрація обов"язкова - кількість місць обмежена!!!