社会の状態に関するデータを取得するために、あらゆる科学が使用されています。それらの1つは統計です。それは何ですか?
これは、一般的な知識の枝の名前です。質量(定量的または定性的)データの収集、測定、分析に関する質問。また、統計は、公共の大衆現象の量的側面をそれらの数値形式の観点から研究しています。この言葉はラテン語のステータスから来ています。これは「情勢」を意味します。当初、この科学は「国家科学」と呼ばれていました。
「統計」という用語が1746年に初めて使用されました年、そしてこの瞬間は、そのような教育分野と科学の始まりを示しました。確かに、データの会計、測定、分析ははるかに早い時期に行われていたため、直接使用されたとは言えません。ファッションは重要なパラメーターです。幾何学から似たようなことを思い出すことができますが、これは完全には正しくありません。しかし、統計におけるファッションとは何ですか?これは、最も頻繁に発生する線形系列の値の名前です。
もっと近いことについて話しましょう現実。ウェブサイトページの統計とは何ですか?このパラメーターは、リソースを入力し、そのコンテンツに精通する機会があったユーザーの数にすることができます。確かに、この観点から、VKontakteの統計は何かという質問に答えるのは難しいでしょう。
ページごとに異なる情報はそうではありません収集します。しかし、1日、1か月、通常は常にログインしているユーザーの数を数えます。これは、情報技術で実際にどのような統計が行われているのかという質問に対する答えです。
科学分野の枠組みの中で、分割が実行されます1つは、特定の点で同種の個別のグループに集約されます。明確なフレームがない場合の間隔の数を計算するために、Sturgesの式がよく使用されます。
CHI = 1 + 3.322 * lg CHN、ここで
目標に応じて、3つのタイプのグループ化が区別されます。
典型的なグループは他の人と可能な限り異なり、自分の中で最も似ていること。それらは一次および二次です。前者は統計観測中に形成されます。二次グループ化は、受信したデータに基づいて行われます。
彼らはほとんどどこでも彼らのアプリケーションを見つけました。したがって、普遍的なツールはないと想定するのが論理的です。特異性と特定の問題への没頭に応じて、データ分析の次の統計的方法が区別されます。
科学のこのセクションでは、データ処理を扱います任意の性質。数理統計と確率論は、応用統計とその分析方法の数学的基礎として機能します。それはすべて、取得されたデータのタイプの説明と、それらの起源のメカニズムから始まります。このために、確率論的および決定論的方法が使用されます。後者は、研究者が自由に使える十分なデータがある場合にのみ使用できます(たとえば、企業から提供された情報に基づく州の統計機関からのレポート)。しかし、得られた結果をより大きなスケールに転送し、見通しを評価するには、確率的および統計的モデリングを使用することしかできません。
最も単純な状況では、利用可能なデータは次のとおりです。調査中のオブジェクトの特徴である特定の機能の意味として。ここでのパラメーターは、定量的または指標的です(それらが属するカテゴリーによって異なります)。 2番目のオプションは通常、品質特性について説明します。しかし、あなたがそれらのいくつかを取るとどうなりますか?または定量的なものを追加しますか?そうすれば、物体のベクトルが得られたと言えます。これは新しい種類のデータと見なされています。大規模な研究では、サンプルはいくつかのベクトルのセットで構成されます。受け取った情報を明確にし、再確認することが重要です。このために、リサンプリングが使用されます。
ご覧のとおり、統計を使用すると構造化できます特定の地域の状況に関する情報を提供できるようにするために必要な大量のデータ。それで、それは州の経済の成長のダイナミクスを観察することを可能にするので、それは投資家にとって重要な役割を果たします。統計は市民や当局にとっても興味深いものであり、人口動態の成長や危機、福祉の増加や衰退など、国のプロセスについて伝えています。