Приложение Knime - аналитическая платформа для обработки данных
Оценка 4.9

Приложение Knime - аналитическая платформа для обработки данных

Оценка 4.9
Компьютерные программы
docx
информатика
9 кл—11 кл +1
24.09.2021
Приложение Knime - аналитическая платформа для обработки данных
Приложение Knime - аналитическая платформа для обработки данных. В работе предлагается ознакомиться с возможностями работы с базами данных и обработкой данных. Программа дает эти возможности даже для пользователей не разбирающихся в программировании.
1 KNIM - аналитическая платформа.docx

Приложение для анализа и обработки данных KNIME: общие сведения, понятие рабочего процесса, инструменты

 

Аналитическая платформа KNIME - Data Science без программирования

 

KNIME - бесплатное приложение для анализа и обработки данных.

Кроме свободного распространения, KNIME не требует от пользователя больших знаний программирования и визуализирует процесс обработки так, что созданный процесс одновременно является и инструкцией к самому себе. Если есть идея о том, что вы хотите в финале сделать с «сырой» таблицей (выгрузкой, текстом, вообще каким-либо набором разрозненных данных), то KNIME обеспечит полный цикл анализа данных, включающий чтение из различных источников, преобразование и фильтрацию, сам анализ, визуализацию и экспорт. 

Выглядит это примерно так:

Аналитическая платформа KNIME - Data Science без программирования

Скачать KNIME можно отсюда: www.knime.org

 

Рабочий процесс - Workflow

В Knime логика обработки данных закладывается через создание Workflow. Workflow состоит из узлов обработки: чтения данных из БД или таблицы Excel, наложения фильтров, сортировки, построения графиков и т.д. Узлы соединяются между собой стрелками которые показывают направление движение данных. 

Заменяем Excel на KNIME: что такое Workflow

После создания Workflow его можно запустить на исполнение. Узлы начинают отрабатывать один за одним, начиная с самого первого. Если в ходе выполнения конкретного узла произошла ошибка, то исполнение всей ветки, следующей за ним, прекращается. Существует возможность перезапуска Workflow не с первого, а с произвольного узла. 

Светофор у каждого узла отражает его текущее состояние: красный – ошибка/не настроен, желтый – настроен и готов к выполнению, зеленый – выполнен. Результат отработки каждого узла можно посмотреть из контекстного меню по нажатию правой кнопкой мыши.

 

Node Repository - инструменты KNIME (ноды)

Узлы обработки данных называются нодами. В левом нижнем углу окна приложения находится репозиторий, из которого ноды можно «вытаскивать» на рабочее пространство.

Заменяем Excel на KNIME: что такое ноды

Узлы разбиты на категории. Вот основные: 

- IO — ввод/вывод данных (здесь находится узел чтения из файла, например, XLS или CSV);

- Manipulation – преобразование данных (фильтрация, сортировка, группировка и т.д.). Здесь же находятся самые важные ноды для любого сотрудника, часто имеющего дело с Excel: функция ВПР и создание сводной таблицы. Их мы разберем в следующих постах;

- Views – визуализация данных (диаграммы, гистограммы и т.д.); 

- Database – возможность подключения к базе данных, чтения/записи. Если ваша работа – не только сводить готовые выгрузки, но и тащить их из базы, то данный блок – ваше спасение. Тоже разберем отдельно;

- Workflow Control – циклы, итерации при выполнении узлов и т.д.

Кроме этого есть ноды для построения корреляций, регрессий, нейронных сетей, проверки гипотез, текст-майнинга, работы с Hadoop и т.д.

Примеры использования нодов можно посмотреть на Knime Hub (https://hub.knime.com/), где есть описание всех нод с примерами на английском языке.


 

Приложение для анализа и обработки данных

Приложение для анализа и обработки данных

После создания Workflow его можно запустить на исполнение

После создания Workflow его можно запустить на исполнение

Узлы разбиты на категории. Вот основные: -

Узлы разбиты на категории. Вот основные: -
Материалы на данной страницы взяты из открытых истончиков либо размещены пользователем в соответствии с договором-офертой сайта. Вы можете сообщить о нарушении.
24.09.2021