Tento web používá soubory cookie. Dalším používáním webu s tímto souhlasíte.
jméno
heslo
přihlásit
zaregistrujte se
zapomněli jste heslo?
Zabbix, nagios a další monitorovací nástroje
SNIPERCZE
Zabbix - "Zabbix offers advanced monitoring, alerting and visualisation features today which are missing in other monitoring systems, even some of the best commercial ones." Nagios - "Nagios is a powerful IT management system that enables organizations to identify and resolve IT infrastructure problems before they affect critical business processes."
Máte k tomu co říct? Vložte se do diskuze.
RATTKIN --- 19:42:36 2.3.2018
TBC: každej by chtěl aby mu někdo udělal referenční řešení (zadarmo) na jeho ultra speciální usecase ... někdy je ale třeba s něčím začít a pak to holt předělat.
BALOS --- 18:06:51 2.3.2018
TBC: Tohle resi zabbix-proxy. Sprava probiha centralne ze Zabbix serveru, ale sber dat zajistujou proxy.
RATTKIN --- 7:05:56 21.2.2018
zabbix má Discovery které automaticky vytváří nové zařízení, ale nevím jak to funguje na SNMP. má to i hromadné změny, skupiny.

Na sběr bych se toho nebál. můžeš si pustit SNMP workerů kolik chceš. limit bude ram, cpu nebo network.
TBC --- 20:41:28 20.2.2018
SAMGARR: ok diky za tip, chapu ze je rozmerem celkem atypicky usecase

RATTKIN: no jde o to, ze spolehat se na dokumentaci je v takovem to pripade malo.. tohle chce referencni reseni

pracuju s icingou ci nagiosem a mam reseni kde dohleduju radove nekolik desitek tisic citacu, vcetne distribuovanyho monitoringu pomoci satelitů, ale to je porad nekde uplne jinde...

CHOROBA: hw zdroje resp. naklady na ne zas nejsou tak limitujici...

limitujici vidim /jak je tu uvadeno/:
- sber a ta parelizace snmp
- db backend, nad kterym idealni potrebuju delat dotazy a nejakou archivni agregaci dat
(samozrejmne pokud by bylo resenim mit treba 10x virtual ktery, kazdy obhospadri 5k device á 200 citacu a pak to sestohuju v centralni db a tam s tim pracuju, tak to vyhovuje)

ale reseni kde to budu mit sber v 10 nodech lokalne v RRD je nadraka. A troufam si rict to by mi to mozna nakonec i utahlo tech 10 satelitů icingy/nagiosu. chce to i nejakej inteligentni provisining novych zarizeni a vyrazeni scriptem atd. Nejakej reporting nad tim atd...

RATTKIN --- 21:36:17 19.2.2018
taky u opensource je důležité hledisko jaký je použitá technologie, případně jestli je to technologie, kterou se chceš učit
SAMGARR --- 21:11:41 19.2.2018
TBC: U zabbixu jde prakticky o skalovani databaze pro zapis. A pokud se ti nechce zacit primym testovanim zkus IRC zabbixu, vzdycky tam je nejaky vyvojar ochotny vyvojar.
Prometheus jsem doporucoval protoze je dimenzovany 100k zapisu/s a vic.
RATTKIN --- 20:28:23 19.2.2018
TBC: a podle čeho jiného? u open source projektu je dobrá dokumentace velká výhoda.

zatím se nikdo z nyxáků neozval, kdo by měl milion snmp zařízení.
tak ještě zkusit nějaké zahraniční fóra (stackexchange) a pak placený konzultant, ale ten ti opensource nedoporučí ;-)
CHOROBA --- 20:16:50 19.2.2018
zalezi i co mas na to za masinu/masiny/rozpocet. od toho bych se odpichnul
obecne mi prijde, ze vic drbani bude s cacti, musi se vic nastavovat a ladit, ale zase rozhodne zere min zdroju nez zabbix , tedy jeden server ti utahne vic polleru a zpracuje vic citacu/grafu.

ja honil na 2Xeon s 8G ram asi 5000+ devices s par 10k grafu.
nska mam na distribuovanym reseni 23000+ zarizeni a grafu asi tak 100k
TBC --- 19:17:30 19.2.2018
RATTKIN: škoda, no rozhodovat se na muj usecase podle dokumentace, to by bylo trochu nezodpovedne :)
RATTKIN --- 18:19:59 19.2.2018
TBC: mám agenty, SNMP i VMware přes ipmi. všechno funguje. když těch zařízení budou miliony, tak by to chtělo nějaký sizing guide.
já nemám škálu co tu hledáš, ale můj zabbix má 1 cpu a 20 giga disk :)

tady je trochu popsaný snmp https://www.zabbix.com/documentation/3.0/manual/config/items/itemtypes/snmp

tohle je o škálování:
Scalable Zabbix – Lessons on hitting 9400 NVPS | Zabbix Weblog
http://blog.zabbix.com/scalable-zabbix-lessons-on-hitting-9400-nvps/2615/

já jiný monitoring neznám, ale rozhodoval bych se podle toho kdo má lepší dokumentaci na tvůj usecase