Професионално образование

Пътят към успеха

РАЗРАБОТEНА БАЗА ОТ ДАННИ ЗА НУЖДИТЕ НА CONTROL-M

Резюме. Бързите темпове на развитие на компютърните системи и нуждата от своевременна и правилна обработка на огромно количество данни налагат разработването на бази от данни. Базите от данни, използвани във всички сектори от нашето ежедневие, са гръбнакът на IT сектора. С цел бързото и правилно управление на една или повече БД се налага тяхната автоматизация. В доклада е представена технологията Control-M, въз основа на която се постига комбинирано използване на различни отрасли в IT сектора само от една програма.

Ключови думи: Data base, Automation, Batch, Scheduling, Control-M

Въведение. През последното десетилетие на нашия век обемът на използваната, съхраняваната и управлявана информация нараства лавинообразно. Паралелно с това нараства и общият обем на вложените средства с цел модернизиране на бизнеса, като тези капиталовложения надхвърлят един трилион долара (Kuhn, Alapati & Padfi eld, 2012). Тези мащабни инвестиции са направени с цел анализиране, синтезиране и използване на натрупаната информация за вземане на правилни и навременни бизнес решения. Основните усилия на фирмите са насочени към категоризиране и отсяване на ценната информация.

Днес повечето организации разполагат с достатъчно данни, за да вземат сериозни бизнес решения, но в по-голямата си част тази огромна по обем информация се пази в „релационни“ бази от данни или в наследени стари системи (мейнфрейм, работни станции и сървъри) и рядко се използва за анализ и вземане на критични бизнес решения.

Mного от съвременните организации разполагат с достатъчно данни, за да могат да вземат сериозни бизнес решения, но за да се развива бизнесът по-бързо, успешно и сигурно, част от тези решения се базират на automation софтуер.

В доклада е представена идеята за автоматизация на реална база от данни, използваща Control-M.

Разработване на база от данни. Базата от данни (БД) е вид набор от организирани факти. Всеки от известните носители за съхранение на данни може да представлява вид база данни от събрана информация, която е организирана така, че да бъде лесно достъпна, менажирана и актуализирана (Fernandez, 2009). Проблемът е, че някои от системите за съхранение на бази данни не предоставят никакви вградени средства за автоматично сортиране, отпечатване или управление на данните. Именно за реализация на тези функции възникват системите за управление на бази данни.

Известните системи за управление на бази се делят на два метода: йерархичен метод и релационен метод. Най-използваният и запазил се до днес е релационният метод, надграждащ йерархичния метод (Fernandez, 2009; Antognini, 2014).

Системата за управление на бази от данни (СУБД) e набор от инструменти за управление на данни в определен формат. Елемент, използван във всички системи за управление на бази данни, е машината за бази данни. Машината за бази данни (database engine) е приложение, като например Microsoft Access, Oracle и други, които обработват данните в базата данни (Fernandez, 2009). Тя е сърцето на една СУБД. Обикновено тази система е или обектоориентирана, или релационна. До момента няма обектоориентирана СУБД, масово използвана от потребителите.

Релационният модел е основният ползващ се и до днес. Различните видове бази от данни зависят от производителя си – Oracle, MySQL, PostgreSQL, Microsft Access и други (Kuhn, Alapati & Padfi eld, 2012).

Важен е въпросът „Как бихме могли да ползваме всичките тези изброени бази данни в една обща платформа? “. Отговорът на този въпрос дава автоматизацията на базите от данни с Automation софтуера Control-M.

Автоматизация на базите от данни. Темповете на развитието на съвременните бази от данни налагат тяхната автоматизация. По своята същност Automation е софтуер, осигуряващ изпълнение на едно или повече действия без намесата на човека. С цел да се постигне автоматизация на една БД, е необходимо наличието на голям набор от собствена интегрира база.

Control-M е един от софтуерите, които се занимават с този Automation. Една от основните задачи на Control-M e да предостави на бизнеса бързи и своевременни решения с цел неговото развитие, като комбинира различни функции, необходими на бизнеса, в един цял софтуер за управление (Qiang Ding, 2012).

Същността на тази автоматизация са Batch&Scheduling. Това понятие е относително неизвестно спрямо много други, дори и в Google няма много на брой статии и информация за него. Известни Automation технологии са Autosys, TWS, UC-4 и други.

Основните работни единици в Control-M са Job и Folder, като Folder е реално съчетание от един или повече Job. Реалният процес/команда, която се изпълнява, лежи върху думата „Job“. Основната работна единици е Job. Той може да бъде всякаква различна команда от различните IT сектори. Благодарение на Control-M можем да създадем Job, който например да изпълнява Java процес и да вземе неговите изходни данни и да ги даде на SAP процес (Qiang Ding, 2012). В това се изразява голямата сила на Control-M и благодарениена него два различни отрасъла в IT сектора, като SAP и JAVA, могат да функционират заедно.

Folder, от своя страна, има също важно значение. За да може всичко да бъде прегледно и разбираемо за потребителите, съществува възможността за сортиране на различните процеси по разбираем за нас начин в различни папки. Едно от най-големите приложения на Folder е използването им за направата на разбираем интерфейс.

Batch – „ Действия, които се изпълняват автоматизирано без човешка намеса“.

SchedulingИзпълнение на действие или действия според стриктен график“ (Feuerstein, 2005).

Batch & Scheduling – значението на цялото това съчетание е да се изпълняват автоматични действия без човешка намеса през даден интервал от време.

Пример за използване на Batch&Scheduling. При наличието на процес (Job), които трябва да се изпълни, е необходимо задаването на време – Scheduling (защото евентуално след него ще се чака друг процес). В този случай SAP процесът чака JAVAпроцеса и за да може всичко да върви по план, трябва да се спазва Scheduling. От другата страна пък стои Batch. Като цяло, от обясненото дотук би трябвало да разбираме, че самият Batch e автоматичен процес и той не изисква нашата намеса. Това е абсолютно вярно, но даденото действие/команда, зададено да се изпълнява автоматично, е вероятно написано от потребителя. Тук се появява факторът човешка грешка и поради това е възможно Batch процесът да има своите проблеми. Затова при проблем с дадена команда (Job) се разглежда от Batch процеса.

В живота на човека всичко се измерва с време. Времето е изкуствена количествена мерна единица, създадена от нас хората. Ако се замислим, доста софтуери по цял свят не могат да работят без тази толкова на пръв поглед несъществена константа, но реално много важен фактор. За да има Automation, трябва да има Batch & Scheduling – следи дали Automation работи коректно. При проблем с времето в Automation то това засяга Scheduling, докато при проблем със самия процес (Job) на дадената задача това засяга Batch.

На фиг. 1 е представен нагледен пример за проста изградена система за наблюдение и автоматизация, състояща се от две папки с цел по-добра прегледност. Всичките папки в предложения пример стоят върху сървъра Hell-PC, на който има инсталирана база от данни.

Фигура 1. Работна схема за движение на данни

Реалната първа стъпка в база Hell-PC e създаването на двете папки Folder#1 и Folder#4. От примера е видно, че името на папката и редът на броене нямат значение.

Във Folder#1 е създаден джоб с името „Create fi le SYS“ с цел в него да се екстрактват данни от зададена таблица, поставена във файл.

Съществува и втори джоб – „ File Watcher_SYS“, които наблюдава целия този процес. След като процесът от „Create fi le SYS“ завърши според зададени правила, това бива засечено от „File Watcher_SYS“ и той включва за изпълнение „Delete fi le SYS“, който има първа основна функция да изтрива вкараните стари данни в джоба „Create fi le SYS“ и втора важна функция, която изпълнява, е да включи джоба „Create fi le SYS“ отново в работен режим. Така се постига една постоянно движеща се схема, която ще процесва нашите данни постоянно, без да се налага някакво наше действие.

Заключение. Създаването на консистентна и коректно работеща база от данни за определени нужди на конкретен потребител е основното средство, без което нито един отрасъл в IT сферата не би се развивал и работил правилно.

В доклада е представен софтуер за автоматизация на база от данни Control-M, който се грижи за своевременното получаване на нашите заплати навреме, за плащането на нашите сметки автоматично позададени правила и др.

В днешни дни сме свидетели на все повече автоматизиране на нашето ежедневие. Практиката показва, че тези дори и корпоративни Automation софтуери все повече ще навлизат, защото благодарение на тях се съчетава една обща платформа на развитие. Платформа, която има задачата да улесни бизнеса и различни IT сектори с цел да могат всички те да се развиват и да освобождават ресурс от свободно време за по-необходими и важни неща за конкретния потребител.

NOTES / БЕЛЕЖКИ

1. Авторът е студент в специалност „Безжични комуникации и разпръскване“, катедра „Телекомуникационни технологии“, Факултет по телекомуникации и мениджмънт.

Консултант при изработване на настоящия текст е гл. ас. д-р инж. Eкатерина Оцетова-Дудин, катедра „Информационни технологии“, Висше училище по телекомуникации и пощи. E-mail: eotsetova@abv.bg.

REFERENCES / ЛИТЕРАТУРА

Kuhn, D., Alapati, S. & Pad field, B. (2012). Expert Indexing in Oracle Database 11g Maximum Performance for your Database. Apress.

Fernandez, I. (2009). Beginning Oracle Database 11g Administration. Apress.

Antognini, C. (2014). Troubleshooting Oracle Performance. Apress.

Qiang Ding. (2012). BMC Control-M 7: A Journey from Traditional Batch Scheduling to Workload Automation. (available on https://www.packtpub. com/application-development/bmc-control-m-7-journey-traditionalbatch-scheduling-workload-automation).

Feuerstein, S. (2005). Oracle PL/SQL Programming, 4th Edition. O'Reilly.

Година XVIII, 2016/3 Архив

стр. 265 - 269 Изтегли PDF