Press "Enter" to skip to content

GOTO 2012 • Real-time Analytics with Apache Cassandra • Richard Low


Non voglio parlarti oggi
Cassandra in tempo reale, quindi vado a
iniziare per un completamente astratto
cominciando a pensare al tempo reale cosa
è in tempo reale cosa vogliono le persone a casa
in tempo reale, di cosa hanno bisogno?
o X su tutto quello che potremmo
voglio e ho intenzione di pensare a cosa
significa per il tuo database come stai
memorizzi i tuoi dati come dovrebbe il tuo
il tuo database esegue per darti quelli
aspetti di tempo reale e poi vado
per mostrare come Cassandra ne ha molte
quelle proprietà per i modi in tempo reale noi
costruito per applicazioni in tempo reale lo farà
parlare di qualcosa di concreto
alcuni degli interni di cassandra e
perché è davvero una buona scelta per un reale
applicazione temporale e quindi sì un po ‘
su come si scrive effettivamente un vero
applicazione del tempo in cima a Cassandra così
iniziano quasi facendo la domanda
ciò che è in tempo reale tutti usano la parola
o cosa diavolo significa così io
cercalo su google come fai e hai te
c’è una sorta di diverso
tipo di risposte ce ne sono alcune che danno
tu un tempo come me impostazioni o
microsecondi ce ne sono alcuni che dicono
immediatamente o cosa significa questo ma
presumibilmente è abbastanza veloce qualcuno
Dice che dovrebbe essere prevedibile, si tu
probabilmente voleva essere ragionevolmente
prevedibile no forse sai che sta andando
essere meno di un secondo è tutto te stesso
preoccupati ma non puoi mai essere di più
di un secondo sì, anche questo è utile
una di queste cose in realtà mi sono così um
appena prima di provare a rispondere
domanda solo una sorta di cosa cosa
forse potresti avere familiarità con un vero
tempo così uno è questo tipo di web
cosa di analisi in cui stai guardando
chi è dalla tua parte ora cosa sono adesso io
non troverai quello di qualcuno
accesso al tuo sito sai a
nanosecondo fa in Australia perché è così
silenziosa anche la velocità della luce non è nemmeno lasciata
te lo hai fatto scoprire così non lo è
una specie di ora è principalmente nell’ultimo
in secondo luogo un’altra cosa è i prezzi delle azioni così
se sei un commerciante seduto nel
non restiamo in un posto che vuoi
per sapere qual è il prezzo adesso non lo fai
voglio che sia vecchio perché poi lo farai
prendere una decisione sbagliata ma ovviamente lo è
non ora forse in città forse è così
come pochi microsecondi che è
è abbastanza veloce quindi forse è questo
significano in tempo reale a sinistra e cosa
una sorta di che tipo di domande facciamo
in realtà faccio così parlerò di come questi
le query funzionano davvero dopo sono solo
una sorta di query che potresti desiderare
rispondere in tempo reale è darmi
qualcosa che è una chiave mi dà un valore
o sai dammi il prezzo delle azioni va bene
vuoi che succeda presto o tu
potrebbe volere una serie di cose che mi danno
tutto tra A e D è lo stesso
con o potresti voler sapere
roba su qualcosa come quanti di
queste cose mi danno quella risposta
rapidamente qual è la top 10 persone
visitare il mio sito Web o i primi 10 paesi
visitando il mio sito Web ora dammelo
risposta o quanti visitatori unici hanno
L’ ultimo mi ha dato questo
rispondere rapidamente a domande come questa
cose che la gente vuole sapere velocemente
okay, ora ho una risposta
cosa intendo in tempo reale è su a
a proposito, matematico, quindi mi dispiace
sulla formalità di questo non sta andando
essere avanti per il resto um so
quindi cosa penso che tutti noi intendiamo per sempre
in tempo reale è quanto tempo ci vuole
arrivare alla risposta quindi se lo stai chiedendo
per qualcosa di enorme come un film te
voglio che inizi a scaricare velocemente e
quindi scarica a due megabyte a
secondo, lo prendi tra mezz’ora
Direi che è il momento giusto per la mia mossa se
ci sono voluti sei mesi per ottenerlo e
è piuttosto lento, quindi se lo chiedi
per un prezzo azionario significa che sta andando
dover venire molto velocemente così il
ragione per cui sto dicendo che lo sto facendo
definizione giusta
è così che più sei tutto
lungo sta andando a prendere se mi chiedi per
la cronologia del prezzo delle azioni per ogni singolo
fermarsi per gli ultimi 10 anni ancora
voglio saperlo velocemente perché lo sono
andando a fare qualche calcolo basato su
ma non posso dartelo in un
microsecondo perché sta per succedere
richiedere più tempo di così comunità
quindi limitiamolo dalla rete che
è la cosa che in realtà hai
essere limitato dalla rete, quindi facciamolo
usiamola come nostra limitazione se
siamo molto più lenti di quello in cui ci troviamo
guai così così sì sì il vero
il tempo era il tipo di scale temporali
parlare di quanto tempo mi serve
insieme e tutti quindi c’è così per
piccole cose c’è una sorta di c’è un
il tempo di andata e ritorno c’è un dolore simile a a
pochi millisecondi forse sono finiti
Internet e ancora ovvia cosa no
quieren può richiedere meno tempo di quanto necessario
per riceverlo che è appena fuori di esso
quindi non sto davvero dicendo molto è
abbastanza ovvio, ma ci sto provando
per tipo di formalizzare per dare effettivamente
hai una scala temporale e useremo
questo per dedurre alcuni aspetti di a
la soluzione in tempo reale deve avere così alcuni
altri motivi per cui penso che funzioni
abbastanza bene se sei su un più veloce
rete probabilmente ti aspetti una più veloce
risposta quindi se ripensate al
la prima volta che sei mai andato online sei
probabilmente usando un quadrante modem a 14.4 k
nel tuo ti ci metto un minuto
connetti e poi vai su una pagina web
e vivi e la grafica viene davvero
piano piano queste cose progressive in jpg
che gradualmente migliorano
prenditi 30 secondi solo per avere un piccolo
immagine e come il minuto carica a
pagina web la prima volta che l’ hai fatto tu
probabilmente pensato wow che è molto veloce
perché prima di conoscerti abbiamo dovuto
vai a comprare un libro o quello che sai
qualcosa che è molto lento scoprire
qualcosa um così così allora si avrebbe
ho pensato che è piuttosto veloce ma ora
se si va a una pagina web e ti porta
cinque secondi per il download pensi
è davvero qualcosa che sto per
rinunciare non sto bene, userò questo
quindi se sei dentro se tu se paghi
spazio nella Borsa di Londra
per ottenere quel microsecondo dolore, se così fosse
ti prende una seconda tempesta per molto tempo
sarai molto arrabbiato sai che lo farai
manuale così così sì sì, quindi penso che sia così
il tipo di catture cattura questo tipo
di crescere verso l’ottenimento in tempo reale
in modo più veloce diamo uno sguardo ad alcuni
implicazioni di questo con un esempio così
questa è la domanda che voglio chiederti
voglio riprendere il braccio dire in realtà
tempo così quante visualizzazioni di pagina ho avuto
dalla Francia nelle ultime 24 ore va bene così
Voglio un numero di telefono dire che è come un
milioni non è molto palpabile con alcuni
sovraccarico di un pacchetto di informazioni
qualunque sia forse stati di kilobyte di
dati o di quello che sto chiedendo e ho
una connessione internet abbastanza veloce così
Mi piace il mio viaggio di andata e ritorno è incredibile 10
connessione megabit posso scaricare a
kilobyte in circa me secondo pure così
il traffico di rete dovrebbe richiedere due
millisecondi quindi il database ha ottenuto
dell’ordine di due millisecondi a
rispondere a questa domanda forse sta andando
prendi cinque o forse dieci ma non 100 sai
se avessi quella costante di cui hai bisogno
tenete quel concerto lì dentro ma facciamolo
probabilmente lo vuoi essere piccolo
certamente è costante quindi se il mio traffico
al mio sito web va su e su di te
sapere farla crescere esponenzialmente poi dentro
10 anni di tempo lo faccio a questa domanda
ancora bisogno di prendere due millisecondi
questa è una cosa veramente importante quindi facciamolo
prova e progetta una soluzione per farlo in questo modo
Diciamo che ho alcuni file di log, facciamolo
preparateli per quel lavoro quindi dite che intendo
è un’ora sette che significa che ho
circa sette concerti purché loro e
Ho detto un disco che li memorizza
ci vorranno 70 secondi per leggere
così se ho bisogno di risolverlo in due
millisecondi Non devo avere tutto
questo in memoria e un super veloce
tu o un sacco di dischi o qualcosa e
sì, mentre il mio tasso di successo continua a salire
bisogno di avere sempre più larghezza di banda per
la mia scrivania più memoria per rispondere a questo
domanda in pochi millisecondi non lo è
andando a lavorare fondamentalmente questa soluzione
solo non è una soluzione in tempo reale così
la seconda soluzione è mantenere un
contrastare così ogni volta con il suo tutto va
al nostro sito web incremento un contatore così
Dico che ho un contatore / paese quindi sì
arriva il Regno Unito e quello per sapere se
Sono un forte leader in quello e poi
quello che voglio scoprire quante persone
dalla Francia attraverso il nostro basta leggere il
contatore torno una risposta forse io
devo fare un calcolo dissipativo ma
Posso fare un distinto in pochi
millisecondi quindi posso ottenere il
rispondi in pochi millisecondi e posso farlo
può soddisfare il mio vincolo per davvero
tempo e ancora mentre il traffico sale
il contatore non diventa più grande, quindi non lo fa
occupare più spazio o pochissimo di più
spazio in modo che funzioni così questo è un
questa è una soluzione in tempo reale in modo da ordinare
di generalizzare è un po ‘ reale
soluzione temporale può solo leggere come
molti dati che invierà
allevamento molto più che è
sto andando troppo a lungo su una scala
cattiva con la quantità di dati così così
non funziona quindi significa che è necessario
pre-calcolare alcune di queste risposte così
suona male perché significa che intendo
non so quale domanda voglio chiedere
bene se non dici se non lo dici
il database qualsiasi cosa sulla domanda
vuoi chiedertelo, non puoi
rispondi in tempo reale ed è come se tu
non ti ricordi di aggiungere il tuo indice
oracolo allora farà un tavolo
scannerizza solo fatti fondamentali che ha
deve farlo in modo da avere qualsiasi database
devi dirlo qualcosa sul
fonte di domande che vuoi fare e se
fai qualcosa al di fuori di quello che è
sta per essere perfettamente lento quindi sì
bisogno di dire qualcosa in precedenza
ma non tutto ciò che non dici che voglio
per conoscere l’intoppo dalla Francia nel
le ultime 24 ore forse forse tu dici di essere io
voglio solo sapere i colpi di qualsiasi
paese sono in ogni momento e poi i secchi
potresti chiedere ad Ashley o è stato l’anno scorso
cos’era nell’ultimo minuto così sei
Non non sei solo sostenuto che uno
numero è nell’ONU che hai multiplo
quelli che hai una specie di avere
modello per le tue domande forse lo faresti
fare così non è non è un disastro, ma
hai bisogno di sapere qualcos’altro
stai memorizzando i tuoi dati come sei
andando a leggerlo non ne ha il diritto
questo è il tipo di passaggio da simile
database tradizionali fino a in tempo reale
le cose ah ok così il modulo che vuoi
la soluzione vuole solo chiarire un punto
che la gente ottiene guardare un po ‘vista
la confusione su questo è una specie di
due volte qui uno è quanto tempo lo fa
portami a prendere la risposta e uno è come
vecchio è il dato che viene interrogato così
Io così così forse con quei prezzi delle azioni io
voglio ottenere il valore ora rapidamente te
vedi ci sono due volte lì o forse tu
vuoi avere dati storici forse
vuoi dire qual era il prezzo 24
ore fa vuoi ancora ottenere il
rispondi velocemente ma sono vecchi dati così
ci sono questi due tempi diversi qui
e poi le persone dicono in tempo reale
generalmente significa entrambi ma non lo è
necessariamente il caso quindi se è se lo è
dati storici per esempio si potrebbe
puoi pre-calcolare queste risposte
sai che potresti essere in grado di gestire un Hadoop
disegna ogni notte per darti le risposte
a queste cose e poi a te
sorta di interrogare questo sommario che è
ci sei tu che potresti farlo se tu
se vuoi solo Reno più tardi, ma dentro
generale, se lo fai se stai facendo un rapido
la risposta a una domanda è preziosa allora
allora il valore probabilmente decade nel tempo
quindi probabilmente lo vorrai probabilmente
avere un certo valore nel ricevere le nostre risposte
circa i dati attuali e quindi io sono
andando ad assumere entrambi gli aspetti del reale
tempo qui
preziosi dati attuali e ottenere un
risposta rapida per corrente e
notizie storiche va bene quindi quali sono
soluzioni a questo sai che ne abbiamo visto uno
risolvi i contatori ma andiamo
parla un po ‘più in generale come
questo perché c’è un altro tipo di
domande che vogliamo chiedere così
cosa fondamentale ho costretto ho detto
è che non vuoi leggere più dati
di quello che devi fare per avere gli occhi così
ecco le sue tre cose che vuoi
assicurati di farlo denormalizzare
fondamentalmente significa memorizzare i dati nel file
ordina che lo leggerete
organizzazione dei dati ma assicurati che il tuo
i dati sono organizzati indicizzati a destra
modo che tu non debba arrivare a
scansione della tabella o qualsiasi altra cosa e utilizzare contatori
così abbiamo visto che abbiamo ordinato i contatori come un
ad esempio ci sono anche altre cose
ma questi sono un po ‘alcuni alcuni
tecniche conosciute quindi l’idea di
la denormalizzazione è la più pertinente
per i dischi rotanti ma è anche piuttosto
che per ssds pure e anche pari
memoria perché sai che è anche casuale
accesso in memoria non così veloce come solo
facendo un grande uomo copia um così facciamo
usa il disco perché è quando è quando
è più ovvio, quindi si può leggere
diciamo 100 megabyte al secondo, ma possono farlo
solo 100 letture casuali al secondo, quindi se
hai i dati appena divisi casualmente
attraverso il disco è possibile leggere solo 100
cose esattamente che significa in modo efficace
se hai intenzione di leggere un po ‘di
i dati si può anche leggere un megabyte
perché non hai sempre te
vedi già fino a quel punto, così puoi
ben aspetta un megabyte di dati
approssimativamente a causa del centinaio
megabyte 182 secondi quindi se tu se tu
cercare un punto sul disco di te
efficacemente leggere un megabyte così anche se
stai leggendo solo un byte di dati tu
in realtà pronto a farne uno così è
andando a violare il mio limite che ho
leggi molti più dati di quelli che sto per
spedire in modo che la ricerca non sia consentita e
non è permesso vedere molto sonno uno
una o due volte ma non / cosa che siamo
manderò fuori quello che non sarà
vero
quindi hai usato un’organizzazione che
significa le cose che vuoi leggere
in chiunque all’interno di una query è memorizzato
uno accanto all’altro su disco così l’in
generale che significa che devi copiare il file
dati perché forse vuoi leggere
qualche altro ordine per un diverso tipo di
query così spesso ma spesso lo fai
copia i tuoi dati ma non preoccupiamoci
a proposito di scoppiare in esso è possibile acquistare
questo come cento dollari a terabyte
questo non costa nulla per la capacità, ma per me
oh sai che sto comprando 100 iOS al secondo
per cento dollari e sto pagando un
dollaro all’ora al secondo è abbastanza
molto, eccoci, proviamoci
facciamo un po ‘di blocco in modo correlato
cosa è cosa se penso che sia un po ‘di più
generale che la demonizzazione sta facendo
sicuro che i dati siano disposti a destra
stanno usando l’indice giusto su un disco
quindi sì, non stai facendo il random
accedere così ad un aspetto di questo così
ricorda uno degli elenchi di query di
la gente potrebbe voler fare è ottenere un intervallo
di dati forse questo è un intervallo di tempo o
come una serie di voi sapete tutto
archi o qualcosa di così molto comune
cosa vuoi fare è questa query di intervallo
non conosci la chiave esattamente come te
voglio ma tu sai che era nell’ultimo te
so che è stato questo intervallo di tempo tra di voi
conosco 24 ore fa oggi, quindi facciamolo
questa serie di query va benissimo
le chiavi da E a I ma poi quando
qualcuno non aggiorna noi abbiamo questi
chiavi extra che saranno quelle rosse
le chiavi che sono state aggiunte così abbiamo
alcune nuove chiavi bene se ti attacchi
li sopra, quindi non vengono memorizzati
per ora ho intenzione di avere
cercare in giro per leggerlo ah così è
questo sta per violare il mio sogno
dritto non sta andando in tempo reale
quindi devo avere un metodo per ottenere
da sinistra a destra devo
mantenere questo ordine in un modo che
non implica la ricerca quando inserisco
smetti di fare quello che potrei fare è sapere inserire
g più vecchio, scopriamo dov’è
mettiamolo lì ma lo farà
coinvolgere anche un posto a destra
quello non è che non è permesso così come lo sono
noi come arriviamo da lì a lì così
Ho intenzione di racconterò più tardi su come /
Sondra risolve questo problema molto bene e
eppure l’ultima cosa è il catalizzatore tra
che abbiamo visto così sì, se sei se
la query che stai chiedendo sta contando
qualcosa allora sì, basta mantenere un
Contro così vogliamo qualcosa nella nostra
database che possiamo incrementare e
decremento e stiamo andando ad avere
contatori multipli per quelli sono
cose diverse vanno bene così queste tecniche
parliamo di Cassandra un po ‘così
Sto per introdurre caratteristiche
di Cassandra come abbiamo bisogno di loro per dire come
risolve questi sono questi problemi così
sono le tre tre caratteristiche subito
è giusto ottimizzare cosa?
significa davvero che è super veloce per
diritti e la stessa velocità di qualsiasi altro
database per leggere le letture sono minuscole
un po ‘più lento in alcuni casi, ma tu
non lo noterei così così fondamentalmente super
veloce scrive brezza molto fresca e ancora
questo sta emergendo velocemente così se tu
quando inserisci le tue chiavi finiscono dentro
ordine abbastanza rapidamente non siamo molto
Io oh e cassandra ha una distribuzione
controsupporto credo che la distribuzione
ciò significa che puoi scalare correttamente ma
sul pattinaggio qui, ma assumendo quello
la maggior parte delle persone desidera scalare il proprio database
di nuovo così la saga si è distribuita
anche le capsule così bene
l’ottimizzazione in Cassandra è perché
tutti i diritti sono sequenziali così tu
scrivi quello che vuoi in qualsiasi ordine
finiscono in ordine su disco senza nessuno
cerca quindi non è magico ma lo fa
coinvolgere scrivere cose più volte così
la cosa che stai cercando di fare
è ottenere la diapositiva che avevo prima che tu abbia
alcune chiavi e vuoi inserire il
in mezzo come si ottiene da sinistra a destra
quindi parliamo di alcuni dati
strutture in cassano per vedere come questo
funziona così in pratica si inseriscono alcuni dati
in effetti abbiamo un disco di memoria che abbiamo
due diversi storage che hanno molto
proprietà diverse possono fare cose a caso
memoria e tu cambi e roba su disco
quindi usiamo queste proprietà per fare cosa
vogliamo quindi abbiamo alcuni dati sul disco
quello è felice che è classificato
bit e quindi otteniamo alcuni diritti quindi noi
prendi queste due chiavi Jean cube mettiamole
la memoria contiene un login di commit
Cassandra che li ha appena scritti
caso perché se abbiamo perso il potere ora che
perdiamo questi due valori ma c’è un
commit log per assicurarsi che ciò non avvenga
capita che possa allora riprodurlo ma
tu non vuoi leggere da quello
perché non stanno memorizzando l’ordine lì
quindi non preoccuparti di perdere dati se il
il potere si spegne
braccio okay, quindi abbiamo quelli che abbiamo
due inseriamo di più in questo caso
quando riceviamo sei chiavi, restiamo alle sei
è troppo grande, non ho intenzione di archiviarlo
nella memoria più sto andando a filo
per questo ho creato questo
ordinato la memoria elencata e poi la scrivo
fuori su disco quindi ora tutto quello che ho
su disco è ancora in ordine, ma ora ho
ho qui due file piuttosto che piuttosto
di quello se continuassi a farlo allora
sarebbe solo continuare a costruire con
questi file non sono ancora buoni
qualcosa e dopo che era un file segreto
che non è ancora permesso quindi io
in realtà non ha bisogno di unire questi
insieme quindi c’è questo processo di
unendo anche quella compattazione in
Cassandra che fa così così così questi
due cose sono quindi versione 2 in 1
sfondo così si finisce sempre con
alcuni di questi file su disco quindi sì
osserva che le chiavi sono state scritte bene
come se queste chiavi fossero state scritte due volte
disco piuttosto che piuttosto che una volta
va bene non importa troppo perché
sono tutti scritti in modo sequenziale
so che stiamo facendo questa fusione come 100
megabyte al secondo facendo conoscere il
milioni di chiavi al secondo o qualcosa in
questa fusione è molto veloce quindi se noi
scriverlo alcune volte davvero
non importa ma ciò che questo ci dà è
lo è ogni bit di I / O per la scrittura
il grande sequenziale e le ance bene che ho
ottenuto questa cosa ordinata, vado e trovo
qui dentro o posso fare la mia query di intervallo
non c’è ricerca in c’è un like 12
sedere / leggere così tutto è
ottimo questo significa che posso risolvere il perché
per le mie domande come prendermi qualcosa o
procurami una gamma di qualcosa molto velocemente
e in tempo reale, quindi, quanto velocemente possiamo
Effettivamente farlo bene ne asserisco un po ‘
roba e tu puoi certamente 50.000
Keesey sito abbastanza bene e questo è questo
è un altro questo è il motivo per cui sono Saunders
ottimo per fare denormalizzazione perché
ottieni il tuo inserto che va a 10
o qualcosa e poi perché
può fare migliaia di pesci al secondo
beh, lo sai, forse ne ho dieci
cose qualunque abbiamo un certo
domanda ovviamente che cosa è stato il tuo Kip
Pensa che sì, dirà
che tipo di hardware faresti ah?
questa è una casella di chiamata 24 settimane circa
otto dischi costa circa 2.000 sterline o
qualcosa niente questo non sarebbe questo
non andrei avanti per sempre, intendo
ovviamente sta andando a scendere un autobus
sì, intendo che il momento è giusto
condivisione come il costume della CPU per
elaborando gli inserti un nuovo a 50
deficit che è solo Cassandra una scatola no
chili ok così quelli quelli sono il tipo di
requisiti di archiviazione dei dati che abbiamo
dal vero in tempo reale e Cassandra ce l’ha
proprietà piuttosto buone ci sono
alcuni altri requisiti che penso
sono anche importanti sono così solo una specie
di guida ho pensato qui, quindi stiamo facendo
analisi in tempo reale che significa che abbiamo
ha detto che abbiamo un grande valore nell’ottenere un
risposta rapida se otteniamo una risposta lenta
allora sai che ci costerà
qualcosa che abbiamo detto che volevamo digiunare così
ciò significa che il servizio non è disponibile
stiamo perdendo soldi non siamo noi non siamo
è più veloce fare le nostre domande veloci
andare a esso è effettivamente come è
andando a prendere e come fare la query se
ci vuole o ora per portare il server
backup quindi c’è un alto costo del
il servizio è basso quindi abbiamo bisogno di un massimo
disponibilità quindi ti dà alta
disponibilità con replica
molteplicità e supporto
e tutta quella roba così così sì, penso
non ha senso costruire un tempo reale
sistema che non ha una cauzione elevata
l’abilità su una cosa correlata è di nuovo noi
voglio una risposta rapida che significa noi
bisogno di bassa latenza e in particolare molto
di persone stanno costruendo applicazione e
interrogato in tutto il mondo così Sandra ha multi
date e supporto in modo tale che i dati siano
sta per essere replicato attorno al tuo muro
indica il tuo datacenter in modo che tu possa avere
uno in Australia, uno ad Hong Kong
di un solo e semplice fatto o vicino
abbastanza per le persone in modo che non abbiano
per andare sai a metà strada in tutto il mondo
per ottenere la risposta, quindi penso di sì
Penso di avere quei dati di casa
geograficamente vicino è importante per
alcune applicazioni davvero e ci sono
persone che usano Cassandra solo per questo
funzione solo in modo che possano facilmente
replicare i dati in giro per ottenere ottenere
bassa latenza, quindi credo che sia così
Cassandra realizza queste cose così così
non c’è un singolo punto di errore in
Sandra non è necessario per alto
la disponibilità è possibile in modo equo
caratteristica unica con Cassandra che io
penso sia abbastanza utile puoi scegliere
il tuo punto sulla consistenza e a
curva di disponibilità che non puoi
scambia la tua assistenza preferisco II
disponibile come se ne desideri così tanto
queste analisi che le persone fanno in realtà
non importa se non è abbastanza
giusto sai se ti chiedo se lo so
c’è un milione circa a
milioni di visitatori dalla Francia ed è stato
come 900.000 il mese scorso è tutto ciò che ho
preoccuparsi di uscire dal personaggio è come a
milioni di bambini 87.000 qualunque sia se
il se il valore non è abbastanza consistente
Probabilmente non mi interessa, ma se non riesco a ottenere
la risposta dice che arntz non è disponibile
quindi sono molto triste per così tanto
analisi penso che le persone abbiano preparato
scambiare una certa consistenza per il più alto
disponibilità ma per tutte le cose
non può non esserne il grande
Cassandra puoi sceglierlo con
ogni query tu sai se voglio ottenere
questo valore e voglio fare
certo che è l’ultimo valore che posso
di sicuro assicurati di leggere da tutti
repliche ma poi se una nota giù
ovviamente troll oh oh sì
più senso era um così un po ‘
più su bassa latenza in modo da avere il
il supporto di invio di più giorni ti dà
ti dà bassa latenza ma poi c’è
le altre cose con le cache così tu
puoi dire oh voglio questo
particolare bit di dati da memorizzare
preferibilmente in contanti per qualcos’altro
per ridurre la latenza lì e te
puoi fare la tua ragione parallelamente
attraverso i dischi e qualunque sia la lampadina
la giusta applicazione va bene così è segno di
roba parliamo un po ‘di scrivere il nostro
azione come scrivi questi
domande a Cassandra quindi penso
in realtà questa è la parte più debole di
Cassandra sta effettivamente scrivendo qualcosa
su di esso l’interfaccia
l’interfaccia client per Cassandra non lo è
grande quindi era davvero pessimo questo
interfaccia di risparmio che è stata molto difficile
programma contro poi qualcuno ha scritto alcuni
le librerie client sono un po ‘più semplici ma
è ancora un po ‘doloroso e
straniero ora c’è la query di cassandra cql
linguaggio che è di nuovo migliore di te
Devo ancora scrivere un bel po ‘ di codice
per far funzionare le cose e in generale
il tuo codice è abbastanza legato ai tuoi dati
modella così se tu se decidi di cambiare
come sono i tuoi dati un po ‘
cambia codice che è un po ‘
doloroso quindi sarà bello non farlo
faccio così ho intenzione di essere un po ‘piccolo
un po ‘di ciò che hakuna fa
risolvi questo braccio in modo che hakuna porti qualcosa
per l’ analisi del latino che si trova in cima
cassandra che speriamo morda un bene
interfaccia del programmatore per firmare se sei
facendo questo tipo di query in tempo reale
sono quindi è un HTTP riposante
interfaccia a cui postare eventi jason
e pubblichi per fare alcune domande e tu
ottenere risposte in modo tale che il tipo di codice tu
la necessità di scrivere è carina
non esiste per fare quelle cose, quindi cosa
ti fa ottenere gli eventi in arrivo
dentro e tu li alimenti in cinetica
che poi elabora ciò che deve fare
essere in grado di rispondere alle tue domande così
lo dici un po ‘di quello che tu
voglio fare così voglio rispondere ottenere
numero di conteggi per paese o
qualcosa o o qui sono io sono preoccupato
circa quelle volte e ho avuto
Voglio sapere a quante persone accede
alcune pagine così dici qualcosa del genere
questo dici che questi sono il tipo di
domande che voglio rispondere in tempo reale
e poi quando arriva un evento nel kuna
il magnetismo risolve le cose di cui hanno bisogno
aggiornamento per mantenere questa query così così
non devi scrivere questo codice così io
pensa di leggere questo contatore di quella scena in cui
le aziende agricole calcolano intorno al 2012
contatore, incrementiamo questo perché
non è così difficile fare quella roba ma
è molto difficile passare le date e
il momento di ottenere il fuso orario
correggendo e non scendendo da quelli e
qualunque cosa sia, questo lo fa
per te braccio così sì che tipo di cose
lo fa già nelle statistiche correnti
il lavoro è fatto sull’ingestione che io
ha detto che è quello che devi fare è fare
tipo di cose in tempo reale che fa lui
ha alcuni contenuti di puntura media
roba per le sue statistiche e deviazioni
Min e Max sono alcune di queste cose voi
può fare all’incirca pure così se tu
voglio sapere il numero di unico
visitatori del tuo sito web per farlo
esattamente devi effettivamente archiviare tutto
i visitatori che devi sapere se lo sono
unico o no, quindi non puoi realmente
fare quel tipo di query in tempo reale ma
puoi farlo approssimativamente in tempo reale
dove forse la risposta che stai per
ottenere è un po ‘sbagliato, ma tu
probabilmente non mi interessa quindi così sì
qualche roba di approssimazione lì a
effettivamente rendere queste cose in tempo reale um
si puoi fare il raggruppamento
roba in modo che sia un po ‘di più
potente solo ricevendo un singolo numero
fuori puoi ottenere per gruppi per paese o
qualunque cosa e sì questo era in cima
Apache Cassandra quindi vieni alla fine cosa
ho detto sono così ti ho detto quello che ho
pensare in tempo reale significa città e città di lavoro
ciò significa che noi immagazziniamo i dati
non avere una scelta su come archiviamo
questi dati se lo vogliamo in tempo reale così
sì, cosa dobbiamo fare quanto conserviamo
i nostri dati armano quindi allora perché come
Cassandra ci dà quelle proprietà il
riso superfast la fusione dei contatori
alta disponibilità bassa latenza a sondra
buona scelta se vuoi se tu
voglio un po ‘di tempo e poi sì
stai per tornare alle sei circa là
andiamo grazie, per favore, fai qualche domanda
si si è parlato del pulsante giusto
c’è in memoria prima o poi
arrossendo a questo sì e c’è anche a
situazione hai detto dove c’è molto
il padre è disposto a permetterti di ripetere
quegli eventi tornano in giro se non va
giù per i nemici sì quante volte sono quelli
i letti si strappano al tronco e se lo sono
scritto abbastanza spesso perché non potresti
lavali semplicemente fino alla morte, giusto
qual è l’equilibrio tra questi due così
il valore predefinito è scriverlo ogni 10
secondi Io, ovviamente, sì, se l’avete scritto
dopo tutti allora sei essenzialmente
scrivendolo indica così sì il default
ogni 10 secondi lascia il tipo di
la logica dietro è e hai alcuni
repliche pure così entro 10 secondi da
scrivendolo perderlo devi perderlo
potere a tutte le repliche che vedo così
quando scrive a caso su una nota lo è
distribuendolo direttamente al
repliche su disco e sa scorrere
quei due dischi
no è dentro è nella RAM su tutti loro
ma è anche nella legge su tutti loro
e quindi il log viene svuotato ogni 10
secondi su ya quindi se hai intenzione di perdere
allora devi perdere potere a tutti
le repliche entro dieci secondi da
Ingrid, quindi sai se hai tutto
in un data center e basta fare un
proprio allora puoi perderlo ma non puoi
fai qualcosa a meno che tu non lo sia
andando a cercare su ogni singolo sì yeah
quindi non puoi non puoi costringerti a farlo
se vuoi, ma la maggior parte delle persone non ha lat 43
Puttana, sai che scusa, hai una domanda?
Ho dimenticato di chiederti del tuo tuo
punto di riferimento era quanto grandi erano i diritti
che stavi facendo 50.000 al secondo
erano come non riesco a ricordare per
loro ma erano un piccolo ordine simile
non ti piace come 10 byte per valore o
qualcosa probabilmente come 10 con le chiavi 10 x
il fattore dice che è pacifico ma noi
solo tipo di un singolo evento tipo cose
sì sì e se stai facendo segnalini
nel modo in cui ne parli in seguito
ne parlava incontra poi quelli
sarebbe multiplo allora abbiamo ulteriori diritti
lo farai sì, mi piacerebbe due
incontri così contatori i diritti sono
lo stesso ma il problema è il
replica del contatore così così quando io
voglio aumentare un contatore che scrivo
quell’incremento quindi è solo un diritto
ma poi il modo in cui viene replicato
è in realtà per assicurarsi che loro
non può rimanere il cemento rimanere coerenti
esattamente non esattamente così così quattro conti
sfortunato abbastanza da leggerli
replicarli in giro così se il contatore
in contanti non è così male se sono su
disco allora sì, devi fare dei posti
ma in generale stai aumentando di più
contatori recenti così remoti così emotivi
incrementare i contanti è un peccato
proprietà di Cassandra
replica giusta e hai garanzia
una consistenza del contatore con
scrittori attuali
quindi è ragionevolmente complicato ma il
il sommario è quando ci sei in realtà a
contatore / replica in modo da parlare con uno di
le repliche e quindi si incrementa quello
uno e quello che sa lo sa
conosci quelli che questo ha provocato
lui ce n’è un altro in corso
qui ma questi sono trattati separatamente
e poi e poi quando leggi che sono
in realtà le somme sono così così così
è così che si può si può evitare qualsiasi
tipo di blocco della distribuzione perché
è fatto come la replica va bene con quello
ciò significa che puoi fare solo un diritto a
quel nodo un contatore non sono loro a
quel nodo al momento che potevi fare
un altro aggiornamento contatore ad un’altra nota
ma se li fai alla stessa nota come
Garantite um così ah mi lasci
ricorda come funziona fondamentalmente è io
significa che potresti farlo bloccandoti
quello carica ma non funziona così
memorizza il suo negozio vedendo il
incrementa e quindi li unisce a
due solo due solo il valore uno sì
punta molto su questa struttura di registro se
eri in qualche stato in questo caso
sei su dischi a stato solido sì, c’è
ancora un punto perché lo sai
il tuo tuo il tuo blocco di dimensioni su un tipo
di dire che questo è un 4k o qualcosa del genere
negozio non voglio essere alla ricerca
circa un troppo nuovo ti installano
può ancora ottenere più megabyte per
secondo facendo letture sequenziali sul
cosa nessus che puoi fare a caso
patatine fritte quindi c’è ancora un vantaggio ma
ovviamente molto meno così sì sì così così
Cassandra è stato progettato per funzionare a rotazione
con questo è sicuro ma è ancora così
ha funzionato è ancora benefici su
ma non così tanto che hai qualche tab o
anche strappato così sto indovinando bene
Lo stato solido Ram è tra il buffer
e poi scrivendo questo così fa la nostra canzone
ora sostenete per che immagino
potrebbe si può abbastanza facilmente farlo siamo
roba più recente sarebbe sul SSD
e tutte le cose e oltre su di te
potrebbe fare quel punto è se vuoi
qualcosa di più complicato qui come la maggior parte
più di una roba di accesso che poi sarebbe
essere ragionevolmente difficile ciò che puoi fare
anche se è detto alcuni bit di dati
dovrebbe essere su un SSD in certa cagna
oltre su un sacco di dischi in modo da poter dire I
davvero a cuore questi conti ma loro
non preoccuparti di questi dati storici
qui puoi farlo
più domande
Ok, grazie mille

Please follow and like us: