Sjtatistiek: Versjèl tösje versies

Verwijderde inhoud Toegevoegde inhoud
Statistisch gezien is de kans groot dat de meest Limburgers mogolen zijn.
Stemoc (Euverlèk | biedrages)
Revert to revision 337780 dated 2013-03-07 21:32:17 by Addbot using popups
Tekslien 1:
{{Dialek|Nuts}}
'''Statistiek''' is de wetenschap, de methodiek en de techniek van het verzamelen, bewerken, interpreteren en presenteren van gegevens. Het is een onderdeel van de [[wiskunde]].
'''Sjtatistiek''' is de [[weitesjap]] en praktiek van 't ontwikkele van kennis mit behulp van empirische data oetgedrök in kwantitatieve vorm. 't Is gebasierd op statistische theorie, eine tak van de toegepasde [[wiskunde]]. Binne de statistische theorie, waere willekäörigheid en onzekerheid gemodelleerd doer [[waarsjienlikheidstheorie]].
Sommige auteurs besjouwe statistiek as 'ne tak van besjlissingstheorie, omdat ein doel van statistiek 't producere van de "biste" informatie van besjikbare data is. <!-- [[Statistical practice]] includes the planning, summarizing, and interpreting of observations, allowing for variability and uncertainty. -->
 
{{sjtumpke}}
Statistisch gezien is de kans groot dat de meest Limburgers mogolen zijn.
[[Categorie:wiskónde]]
 
<!-- Interlanguage links -->
[[Statisticus|Statistici]] trachten informatie over een populatie (al dan niet abstract) te krijgen uit de waarneming van een (meestal) beperkt aantal elementen van die populatie, de [[steekproef]] (in het geval dat de steekproef de gehele populatie omvat, spreekt men van volledige telling (census, [[volkstelling]])). De verkregen informatie is dus bijna altijd onvolledig en daardoor onnauwkeurig. Een goede beheersing van deze onnauwkeurigheid is dan ook een essentieel onderdeel van de statistiek. De uitkomsten kunnen voor allerlei aspecten van de wetenschap, de [[politiek]], de [[economie (wetenschap)|economie]], de [[psychologie]] en [[sociologie]], de [[pers (media)|media]] en de samenleving van belang zijn.
 
Het woord "statistiek" is afkomstig van de moderne [[Latijn]]se zin ''statisticum collegium'' (les over staatszaken). Hier is vervolgens weer het Italiaanse woord ''statista'' van afgeleid, dat "staatsman" of "politicus" betekent - vergelijk ons woord [[sociale status|status]] - evenals het Duitse ''Statistik'', dat oorspronkelijk de analyse van staatsgegevens betekende.
 
== Deelgebieden ==
Traditioneel onderscheidt men in de statistiek de volgende deelgebieden:
* Beschrijvende statistiek
* Inductieve (ook: wiskundige, mathematische, beslissende, inferentiële) statistiek
Daarnaast is een soort tussenvorm van beide bovenstaande deelgebieden ontstaan:
* Exploratieve statistiek (data-analyse)
 
=== Beschrijvende statistiek ===
De beschrijvende statistiek houdt zich in principe bezig met de beschrijving van bepaalde gegevens van een [[Populatie (statistiek)|populatie]]. Als voorbeeld kan men denken aan een [[volkstelling]] of [[productiestatistiek]]. De gegevens worden geordend en gereduceerd, indien gewenst tot relevante [[Kengetal (statistiek)|kengetallen]]. In overzichtelijke [[tabel]]len, [[Grafiek (wiskunde)|grafieken]] en [[illustratie|figuren]], zoals [[histogram]]men, [[staafdiagram|staaf]]- en [[lijndiagram]]men, worden ten slotte de gegevens gepresenteerd. Een belangrijk deel van het werk van het [[Centraal Bureau voor de Statistiek]] betreft dit deelgebied.
 
=== Inductieve statistiek ===
In de inductieve statistiek tracht men aan de hand van een steekproef informatie omtrent de gehele populatie te verkrijgen. Om allerlei redenen kan het ongewenst of onmogelijk zijn de hele populatie te onderzoeken. In plaats daarvan onderzoekt men een deel van de populatie: de steekproef. Men verkrijgt zo echter slechts beperkte informatie over de populatie. De inductieve statistiek geeft geschikte methoden en onderzoekt de kwaliteit daarvan. Bekende methoden zijn [[toets (statistiek)|toetsen]], [[schattingsmethode]]n en als combinatie van beide: [[betrouwbaarheidsinterval]]len.
 
=== Exploratieve statistiek ===
Anders dan in de inductieve statistiek, waar uitgegaan wordt van goed gedefinieerde steekproeven, gaat men in de exploratieve statistiek uit van voorhanden zijnde data. Op deze data worden methoden van de beschrijvende statistiek alsook van de inductieve statistiek toegepast met als nadeel dat men over de verdelingen vaak weinig kan zeggen. Daarnaast worden speciale technieken voor dit onderzoeksterrein ontwikkeld.
 
== Populatie en steekproef ==
Een belangrijk begrippenpaar in de statistiek is ''[[populatie_(statistiek)|populatie]]'' en ''[[steekproef]]''. Men dient steeds goed te onderscheiden of men over de populatie (verdeling) spreekt dan wel over de steekproef. De populatie is over het algemeen slechts in formele zin gegeven in termen van een [[kansverdeling]] met enkele onbekende [[parameter]]s. Het zijn deze parameters die men graag zou kennen, maar om uiteenlopende redenen niet kent. Een steekproef verschaft informatie over de parameters, door het geven van een [[schatten|schatting]], het [[statistische toets|toetsen]] van een hypothese over een parameter, e.d. Zo is er het populatiegemiddelde, meestal onbekend, en als schatting daarvan het steekproefgemiddelde. Evenzo is de steekproefvariantie een schatting van de populatievariantie, enzovoorts.
 
Doordat de uitkomst van een steekproef meestal sterk door het [[toeval]] bepaald wordt, maakt de statistiek veel gebruik van de [[kansrekening]].
 
== Stromingen ==
Binnen de inductieve statistiek zijn er twee stromingen te onderscheiden:
* Klassieke statistiek
* [[Bayesiaanse statistiek]]
Het essentiële verschil is dat de klassieke statistici ervan uitgaan dat de parameters van de verdelingen die onderzocht worden, een vaste, zij het onbekende, ware waarde hebben. Door middel van statistisch onderzoek probeert men deze waarde te benaderen via [[schatten|schattingen]], [[statistische toets|toetsen]] en [[betrouwbaarheidsinterval]]len.
 
De Bayesianen geloven niet in een "ware" waarde en staan toe dat de parameters zelf [[stochastische variabele]]n zijn, met een meestal onbekende verdeling. Wel wordt tevoren een veronderstelling over de verdeling gemaakt; de veronderstelde verdeling heet [[a-prioriverdeling]]. Hierdoor kan het [[theorema van Bayes]] toegepast worden. Gevolgen hiervan zijn onder meer dat informatie, ook subjectieve informatie, van buiten de steekproef ingebracht kan worden. Verder betekent het dat de interpretatie van de uitkomsten fundamenteel wijzigt.
 
== Stochastische variabelen en modelveronderstellingen ==
Een centraal begrip in de statistiek is dat van de [[stochastische variabele]]. Deze grootheid vertegenwoordigt in feite de populatieverdeling of de betrokken modelmatige kansverdeling. De steekproefuitkomsten vat men op als waarnemingen aan deze grootheid.
 
De basisveronderstelling bij een statistische analyse over de betrokken verdeling, is daarmee een veronderstelling omtrent de verdeling van de betrokken stochastische variabele; de veronderstelde verdeling wordt het "model" genoemd.
 
Als men bijvoorbeeld met een zuivere dobbelsteen gooit, veronderstelt men dat de waarden die men krijgt, metingen zijn van een stochastische veranderlijke die met kans 1/6 elk van de getallen 1 tot en met 6 aanneemt. Twijfelt men aan de zuiverheid van de dobbelsteen, dan neemt men aan dat een uitkomst ''i'' wordt aangenomen met kans <math>p_i</math>. Deze onbekende kansen zijn de in het geding zijnde parameters.
 
== Onderwerpen van de beschrijvende statistiek ==
* [[Steekproef]]
* [[Eigenschap|kenmerken]]
** [[Kwalitatief kenmerk]]
** [[Kwantitatief kenmerk]]
* [[Gemiddelde]], [[centrummaat]]
** [[Rekenkundig gemiddelde]]
** [[Meetkundig gemiddelde]]
** [[Harmonisch gemiddelde]]
** [[Modus (statistiek)|Modus]]
** [[Mediaan (statistiek)|Mediaan]]
** [[Wetten van de grote aantallen]]
* [[Spreiding]]
** [[Spreidingsbreedte]]
** [[Gemiddelde absolute afwijking]]
** [[Percentiel]]
** [[Variantie]]
** [[Standaardafwijking]]
 
== Onderwerpen van de kansrekening ==
Zie [[kansrekening]]
 
== Onderwerpen op het gebied van toetsen ==
* [[Statistische toets]]en
** [[verdelingsvrije toets|Verdelingsvrije of niet-parametrische toetsen]]
*** [[Kolmogorov-Smirnov]]
*** [[Kruskall-Wallis]]
*** [[Rangsomtoets|Wilcoxon]]
*** [[Mann-Whitney]]
*** [[Chi-kwadraattoets]]
** [[Parametrische toets]]en
*** [[t-toets]]
*** [[F-toets]]
** [[p-waarde]]
** [[Significantie]]
* [[Correlatiecoëfficiënt|Correlatie]]
** [[Correlatiecoëfficiënt]]
** [[Punt-biseriële correlatiecoëfficiënt]]
** [[Spearmans rangcorrelatiecoëfficiënt]]
** [[Kendalls tau]]
** [[Cramérs V]]
* [[Regressie-analyse]]
** [[Lineaire regressie]]
** [[Robuuste regressie]]
** [[Niet-lineaire regressie]]
* [[Theorema van Bayes]]
* [[HMM|Hidden Markov Models]]
* [[Inferentie]]
* [[schatten|Schatting]]
** [[Kleinste-kwadratenmethode]]
** [[Meest aannemelijke schatter]]
** [[Betrouwbaarheidsinterval]]
* [[Variantie-analyse]] (ANOVA)
* [[Hoofdcomponentenanalyse]]
* [[Factoranalyse]]
Statistische gegevens worden regelmatig op een onjuiste manier gebruikt, al dan niet opzettelijk. Zie [[Misbruik van statistische gegevens]].
 
== Zie ook ==
* [[Discriminantanalyse]]
 
== Externe links ==
* [http://www.cbs.nl/ cbs.nl] [[Centraal Bureau voor de Statistiek]] (CBS)
* [http://www.statbel.fgov.be/ statbel.fgov.be] [[Nationaal Instituut voor de Statistiek]] (NIS)
* [http://www.vvs-or.nl vvs-or.nl] [[Vereniging voor Statistiek en Operationele Research]] (VVS-OR)
 
{{Navigatie wiskunde}}
 
[[Categorie:Statistiek| ]]
Aafkomstig van Wikipedia, de Vriej Encyclopedie. "https://li.wikipedia.org/wiki/Sjtatistiek"