ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ
ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਲਾਭਦਾਇਕ ਜਾਣਕਾਰੀ ਦੀ ਖੋਜ ਕਰਨ, ਸਿੱਟਿਆਂ ਨੂੰ ਸੂਚਿਤ ਕਰਨ, ਅਤੇ ਫੈਸਲੇ ਲੈਣ ਦਾ ਸਮਰਥਨ ਕਰਨ ਦੇ ਟੀਚੇ ਨਾਲ ਡਾਟਾ ਦਾ ਨਿਰੀਖਣ, ਸ਼ੁੱਧਤਾ, ਪਰਿਵਰਤਨ ਅਤੇ ਮਾਡਲਿੰਗ ਦੀ ਇੱਕ ਪ੍ਰਕਿਰਿਆ ਹੈ।[1] ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਦੇ ਕਈ ਪਹਿਲੂ ਅਤੇ ਪਹੁੰਚ ਹਨ, ਵੱਖ-ਵੱਖ ਨਾਮਾਂ ਹੇਠ ਵਿਭਿੰਨ ਤਕਨੀਕਾਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰਦੇ ਹਨ, ਅਤੇ ਵੱਖ-ਵੱਖ ਵਪਾਰ, ਵਿਗਿਆਨ ਅਤੇ ਸਮਾਜਿਕ ਵਿਗਿਆਨ ਡੋਮੇਨਾਂ ਵਿੱਚ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ।[2] ਅੱਜ ਦੇ ਵਪਾਰਕ ਸੰਸਾਰ ਵਿੱਚ, ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਫੈਸਲੇ ਨੂੰ ਵਧੇਰੇ ਵਿਗਿਆਨਕ ਬਣਾਉਣ ਅਤੇ ਕਾਰੋਬਾਰਾਂ ਨੂੰ ਵਧੇਰੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਕੰਮ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਨ ਵਿੱਚ ਇੱਕ ਭੂਮਿਕਾ ਅਦਾ ਕਰਦਾ ਹੈ।[3]
ਡਾਟਾ ਮਾਈਨਿੰਗ ਇੱਕ ਖਾਸ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਤਕਨੀਕ ਹੈ ਜੋ ਕਿ ਪੂਰੀ ਤਰ੍ਹਾਂ ਵਰਣਨਯੋਗ ਉਦੇਸ਼ਾਂ ਦੀ ਬਜਾਏ ਭਵਿੱਖਬਾਣੀ ਲਈ ਅੰਕੜਾ ਮਾਡਲਿੰਗ ਅਤੇ ਗਿਆਨ ਖੋਜ 'ਤੇ ਕੇਂਦ੍ਰਤ ਕਰਦੀ ਹੈ, ਜਦੋਂ ਕਿ ਵਪਾਰਕ ਖੁਫੀਆ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਕਵਰ ਕਰਦਾ ਹੈ ਜੋ ਮੁੱਖ ਤੌਰ 'ਤੇ ਕਾਰੋਬਾਰੀ ਜਾਣਕਾਰੀ' ਤੇ ਕੇਂਦ੍ਰਿਤ ਕਰਦੇ ਹੋਏ, ਏਕੀਕਰਣ 'ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਨਿਰਭਰ ਕਰਦਾ ਹੈ।[4] ਅੰਕੜਾ ਕਾਰਜਾਂ ਵਿੱਚ, ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਵਰਣਾਤਮਕ ਅੰਕੜਿਆਂ, ਖੋਜੀ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ (EDA), ਅਤੇ ਪੁਸ਼ਟੀਕਰਨ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ (CDA) ਵਿੱਚ ਵੰਡਿਆ ਜਾ ਸਕਦਾ ਹੈ।[5] EDA ਡਾਟਾ ਵਿੱਚ ਨਵੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੀ ਖੋਜ ਕਰਨ 'ਤੇ ਕੇਂਦ੍ਰਤ ਕਰਦਾ ਹੈ ਜਦੋਂ ਕਿ CDA ਮੌਜੂਦਾ ਅਨੁਮਾਨਾਂ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਜਾਂ ਗਲਤ ਕਰਨ 'ਤੇ ਕੇਂਦਰਿਤ ਕਰਦਾ ਹੈ।[6] [7] ਪੂਰਵ ਅਨੁਮਾਨੀ ਵਿਸ਼ਲੇਸ਼ਣ ਭਵਿੱਖਬਾਣੀ, ਪੂਰਵ-ਅਨੁਮਾਨ ਜਾਂ ਵਰਗੀਕਰਨ ਲਈ ਅੰਕੜਾ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ 'ਤੇ ਕੇਂਦਰਿਤ ਕਰਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਟੈਕਸ਼ਟ ਵਿਸ਼ਲੇਸ਼ਣਅਸੰਗਠਿਤ ਡਾਟਾ ਦੀ ਇੱਕ ਪ੍ਰਜਾਤੀ, ਪਾਠਕ ਸਰੋਤਾਂ ਤੋਂ ਜਾਣਕਾਰੀ ਨੂੰ ਐਕਸਟਰੈਕਟ ਕਰਨ ਅਤੇ ਵਰਗੀਕਰਨ ਕਰਨ ਲਈ ਅੰਕੜਾਤਮਕ, ਭਾਸ਼ਾਈ, ਅਤੇ ਢਾਂਚਾਗਤ ਤਕਨੀਕਾਂ ਨੂੰ ਲਾਗੂ ਕਰਦਾ ਹੈ। ਉਪਰੋਕਤ ਸਾਰੇ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀਆਂ ਕਿਸਮਾਂ ਹਨ।[8]
ਡਾਟਾ ਏਕੀਕਰਣ, ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਦਾ ਇੱਕ ਪੂਰਵਗਾਮੀ ਹੈ, ਅਤੇ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਅਤੇ ਡਾਟਾ ਵਿਜ਼ੂਅਲਾਈਜ਼ੇਸ਼ਨ ਪ੍ਰਸਾਰ ਨਾਲ ਨੇੜਿਓਂ ਜੁੜਿਆ ਹੋਇਆ ਹੈ।[9]
ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਪ੍ਰਕਿਰਿਆ
[ਸੋਧੋ]ਵਿਸ਼ਲੇਸ਼ਣ, ਵਿਅਕਤੀਗਤ ਪ੍ਰੀਖਿਆ ਲਈ ਸਾਰੇ ਹਿੱਸੇ ਨੂੰ ਇਸਦੇ ਵੱਖਰੇ ਹਿੱਸਿਆਂ ਵਿੱਚ ਵੰਡਣ ਦਾ ਹਵਾਲਾ ਦਿੰਦਾ ਹੈ।[10] ਡੇਟਾ ਵਿਸ਼ਲੇਸ਼ਣ, ਕੱਚਾ ਡਾਟਾ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਇੱਕ ਪ੍ਰਕਿਰਿਆ ਹੈ, ਅਤੇ ਬਾਅਦ ਵਿੱਚ ਇਸਨੂੰ ਉਪਭੋਗਤਾਵਾਂ ਦੁਆਰਾ ਫੈਸਲੇ ਲੈਣ ਲਈ ਉਪਯੋਗੀ ਜਾਣਕਾਰੀ ਵਿੱਚ ਬਦਲਦੀ ਹੈ।[1] ਡੇਟਾ, ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦੇਣ, ਪਰੀਖਿਆਵਾਂ ਦੀ ਜਾਂਚ ਕਰਨ, ਜਾਂ ਸਿਧਾਂਤਾਂ ਨੂੰ ਰੱਦ ਕਰਨ ਲਈ ਇਕੱਠਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।[11]
ਅੰਕੜਾ ਵਿਗਿਆਨੀ ਜੌਹਨ ਟੂਕੀ ਨੇ 1961 ਵਿੱਚ ਡੇਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਇਸ ਤਰ੍ਹਾਂ ਪਰਿਭਾਸ਼ਿਤ ਕੀਤਾ:
"ਡਾਟੇ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਪ੍ਰਕਿਰਿਆਵਾਂ, ਅਜਿਹੀਆਂ ਪ੍ਰਕਿਰਿਆਵਾਂ ਦੇ ਨਤੀਜਿਆਂ ਦੀ ਵਿਆਖਿਆ ਕਰਨ ਲਈ ਤਕਨੀਕਾਂ, ਇਸਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਆਸਾਨ, ਵਧੇਰੇ ਸਹੀ ਅਤੇ ਵਧੇਰੇ ਸਟੀਕ ਬਣਾਉਣ ਲਈ ਡਾਟਾ ਨੂੰ ਇਕੱਠਾ ਕਰਨ ਦੀ ਯੋਜਨਾ ਬਣਾਉਣ ਦੇ ਤਰੀਕੇ, ਅਤੇ (ਗਣਿਤਿਕ) ਅੰਕੜਿਆਂ ਦੀ ਸਾਰੀ ਮਸ਼ੀਨਰੀ ਅਤੇ ਨਤੀਜੇ ਜੋ ਡਾਟਾ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ 'ਤੇ ਲਾਗੂ ਹੁੰਦੇ ਹਨ।[12]
ਹੇਠਾਂ ਦੱਸੇ ਗਏ ਕਈ ਪੜਾਅ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਵੱਖ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਪੜਾਅ ਦੁਹਰਾਓਣ ਵਾਲੇ ਹੁੰਦੇ ਹਨ, ਇਸ ਵਿੱਚ ਬਾਅਦ ਦੇ ਪੜਾਵਾਂ ਤੋਂ ਫੀਡਬੈਕ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਪਹਿਲੇ ਪੜਾਵਾਂ ਵਿੱਚ ਵਾਧੂ ਕੰਮ ਹੋ ਸਕਦਾ ਹੈ।[13] CRISP ਫਰੇਮਵਰਕ, ਡਾਟਾ ਮਾਈਨਿੰਗ ਵਿੱਚ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ, ਦੇ ਸਮਾਨ ਕਦਮ ਹਨ।
ਡਾਟਾ ਲੋੜਾਂ
[ਸੋਧੋ]ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਇੰਨਪੁੱਟ ਦੇ ਤੌਰ 'ਤੇ ਜ਼ਰੂਰੀ ਹੈ, ਜੋ ਕਿ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਨਿਰਦੇਸ਼ਿਤ ਕਰਨ ਵਾਲਿਆਂ (ਜਾਂ ਗਾਹਕ, ਜੋ ਵਿਸ਼ਲੇਸ਼ਣ ਦੇ ਮੁਕੰਮਲ ਉਤਪਾਦ ਦੀ ਵਰਤੋਂ ਕਰਨਗੇ) ਦੀਆਂ ਲੋੜਾਂ ਦੇ ਆਧਾਰ 'ਤੇ ਨਿਰਧਾਰਤ ਕੀਤਾ ਗਿਆ ਹੈ।[14] [15] ਇਕਾਈ ਦੀ ਆਮ ਕਿਸਮ ਜਿਸ 'ਤੇ ਡਾਟਾ ਇਕੱਠਾ ਕੀਤਾ ਜਾਵੇਗਾ, ਨੂੰ ਇੱਕ ਪ੍ਰਯੋਗਾਤਮਕ ਇਕਾਈ (ਜਿਵੇਂ, ਇੱਕ ਵਿਅਕਤੀ ਜਾਂ ਲੋਕਾਂ ਦੀ ਆਬਾਦੀ) ਕਿਹਾ ਜਾਂਦਾ ਹੈ। ਆਬਾਦੀ (ਜਿਵੇਂ, ਉਮਰ ਅਤੇ ਆਮਦਨ) ਦੇ ਸੰਬੰਧ ਵਿੱਚ ਖਾਸ ਵੇਰੀਏਬਲ ਨਿਰਧਾਰਤ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ ਅਤੇ ਪ੍ਰਾਪਤ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ। ਡਾਟਾ ਸੰਖਿਆਤਮਕ ਜਾਂ ਸਪਸ਼ਟ ਹੋ ਸਕਦਾ ਹੈ (ਭਾਵ, ਸੰਖਿਆਵਾਂ ਲਈ ਇੱਕ ਟੈਕਸਟ ਲੇਬਲ)।[13]
ਡਾਟਾ ਇਕੱਠਾ ਕਰਨ
[ਸੋਧੋ]ਵੱਖ-ਵੱਖ ਸਰੋਤਾਂ ਤੋਂ ਡਾਟਾ ਇਕੱਠਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।[16] [17] ਅਧਿਐਨ ਅਤੇ ਖੋਜ ਲਈ ਡਾਟਾ ਸ੍ਰੋਤਾਂ ਦੀ ਸੂਚੀ ਉਪਲੱਬਧ ਹੈ। ਲੋੜਾਂ ਨੂੰ ਵਿਸ਼ਲੇਸ਼ਕ ਦੁਆਰਾ ਡਾਟਾ ਦੇ ਰੱਖਿਅਕਾਂ ਨੂੰ ਸੂਚਿਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ; ਜਿਵੇਂ ਕਿ, ਕਿਸੇ ਸੰਸਥਾ ਦੇ ਅੰਦਰ ਸੂਚਨਾ ਤਕਨਾਲੋਜੀ ਕਰਮਚਾਰੀ ।[18] ਡਾਟਾ ਨੂੰ ਵਾਤਾਵਰਣ ਵਿੱਚ ਸੈਂਸਰਾਂ ਤੋਂ ਵੀ ਇਕੱਠਾ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਟ੍ਰੈਫਿਕ ਕੈਮਰੇ, ਸੈਟੇਲਾਈਟ, ਰਿਕਾਰਡਿੰਗ ਡਿਵਾਈਸਾਂ ਆਦਿ ਸ਼ਾਮਲ ਹਨ। ਇਹ ਇੰਟਰਵਿਊਆਂ0, ਔਨਲਾਈਨ ਸਰੋਤਾਂ ਤੋਂ ਡਾਊਨਲੋਡ, ਜਾਂ ਦਸਤਾਵੇਜ਼ਾਂ ਨੂੰ ਪੜ੍ਹ ਕੇ ਵੀ ਪ੍ਰਾਪਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।[13]
ਡਾਟਾ ਪ੍ਰੋਸੈਸਿੰਗ
[ਸੋਧੋ]ਡਾਟਾ, ਜਦੋਂ ਸ਼ੁਰੂ ਵਿੱਚ ਪ੍ਰਾਪਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਪ੍ਰਕਿਰਿਆ ਜਾਂ ਸੰਗਠਿਤ ਕੀਤਾ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ।[19] [20] ਉਦਾਹਰਨ ਲਈ, ਇਹਨਾਂ ਵਿੱਚ ਹੋਰ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ, ਅਕਸਰ ਸਪ੍ਰੈਡਸ਼ੀਟ ਜਾਂ ਅੰਕੜਾ ਸਾਫਟਵੇਅਰ ਦੀ ਵਰਤੋਂ ਦੁਆਰਾ, ਇੱਕ ਸਾਰਣੀ ਫਾਰਮੈਟ ਵਿੱਚ ਡੇਟਾ ਨੂੰ ਕਤਾਰਾਂ ਅਤੇ ਕਾਲਮਾਂ ਵਿੱਚ ਰੱਖਣਾ ਸ਼ਾਮਲ ਹੋ ਸਕਦਾ ਹੈ (ਜਿਸਨੂੰ ਢਾਂਚਾਗਤ ਡਾਟਾ ਕਿਹਾ ਜਾਂਦਾ ਹੈ)।[13]
ਡਾਟਾ ਸਫਾਈ
[ਸੋਧੋ]ਇੱਕ ਵਾਰ ਪ੍ਰਕਿਰਿਆ ਅਤੇ ਸੰਗਠਿਤ ਹੋਣ ਤੋਂ ਬਾਅਦ, ਡਾਟਾ ਅਧੂਰਾ ਹੋ ਸਕਦਾ ਹੈ, ਡੁਪਲੀਕੇਟ ਸ਼ਾਮਲ ਹੋ ਸਕਦਾ ਹੈ, ਜਾਂ ਗਲਤੀਆਂ ਸ਼ਾਮਲ ਹੋ ਸਕਦੀਆਂ ਹਨ।[21] [22] ਡਾਟਾ ਦੀ ਸਫਾਈ ਦੀ ਜ਼ਰੂਰਤ ਡੈਟਮ ਨੂੰ ਦਾਖਲ ਅਤੇ ਸਟੋਰ ਕਰਨ ਦੇ ਤਰੀਕੇ ਵਿੱਚ ਸਮੱਸਿਆਵਾਂ ਤੋਂ ਪੈਦਾ ਹੋਵੇਗੀ।[21] ਡਾਟਾ ਸਫਾਈ ਇਹਨਾਂ ਗਲਤੀਆਂ ਨੂੰ ਰੋਕਣ ਅਤੇ ਠੀਕ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਹੈ। ਆਮ ਕੰਮਾਂ ਵਿੱਚ ਰਿਕਾਰਡ ਮਿਲਾਨ, ਡਾਟਾ ਦੀ ਅਸ਼ੁੱਧਤਾ ਦੀ ਪਛਾਣ ਕਰਨਾ, ਮੌਜੂਦਾ ਡਾਟਾ ਦੀ ਸਮੁੱਚੀ ਗੁਣਵੱਤਾ, ਡੁਪਲੀਕੇਸ਼ਨ, ਅਤੇ ਕਾਲਮ ਵਿਭਾਜਨ ਸ਼ਾਮਲ ਹਨ।[23] ਅਜਿਹੀਆਂ ਡਾਟਾ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਕਈ ਤਰ੍ਹਾਂ ਦੀਆਂ ਵਿਸ਼ਲੇਸ਼ਣਾਤਮਕ ਤਕਨੀਕਾਂ ਰਾਹੀਂ ਵੀ ਪਛਾਣਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਉਦਾਹਰਣ ਲਈ; ਵਿੱਤੀ ਜਾਣਕਾਰੀ ਦੇ ਨਾਲ, ਖਾਸ ਵੇਰੀਏਬਲਾਂ ਦੇ ਕੁੱਲ ਦੀ ਤੁਲਨਾ ਵੱਖਰੇ ਤੌਰ 'ਤੇ ਪ੍ਰਕਾਸ਼ਿਤ ਸੰਖਿਆਵਾਂ ਨਾਲ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ ਜੋ ਭਰੋਸੇਯੋਗ ਮੰਨੇ ਜਾਂਦੇ ਹਨ।[24] [25] ਅਸਧਾਰਨ ਰਕਮਾਂ, ਪੂਰਵ-ਨਿਰਧਾਰਤ ਪਹੁੰਚ ਉੱਪਰ ਜਾਂ ਹੇਠਾਂ, ਦੀ ਵੀ ਸਮੀਖਿਆ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ। ਡਾਟਾ ਸਫਾਈ ਦੀਆਂ ਕਈ ਕਿਸਮਾਂ ਹਨ, ਜੋ ਕਿ ਸੈੱਟ ਵਿਚਲੇ ਡਾਟਾ ਦੀ ਕਿਸਮ 'ਤੇ ਨਿਰਭਰ ਹਨ; ਇਹ ਫ਼ੋਨ ਨੰਬਰ, ਈਮੇਲ ਪਤੇ, ਰੁਜ਼ਗਾਰਦਾਤਾ, ਜਾਂ ਹੋਰ ਮੁੱਲ ਹੋ ਸਕਦੇ ਹਨ।[26] [27] ਆਊਟਲੀਅਰ ਖੋਜ ਲਈ ਮਾਤਰਾਤਮਕ ਡੇਟਾ ਵਿਧੀਆਂ, ਉਹਨਾਂ ਡੇਟਾ ਤੋਂ ਛੁਟਕਾਰਾ ਪਾਉਣ ਲਈ ਵਰਤੀਆਂ ਜਾ ਸਕਦੀਆਂ ਹਨ ਜੋ ਗਲਤ ਤਰੀਕੇ ਨਾਲ ਇਨਪੁਟ ਹੋਣ ਦੀ ਉੱਚ ਸੰਭਾਵਨਾ ਜਾਪਦੀ ਹੈ।[28] ਗਲਤ ਟਾਈਪ ਕੀਤੇ ਸ਼ਬਦਾਂ ਦੀ ਮਾਤਰਾ ਨੂੰ ਘਟਾਉਣ ਲਈ ਟੈਕਸਟੁਅਲ ਡੇਟਾ ਸਪੈਲ ਚੈਕਰਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ। ਹਾਲਾਂਕਿ, ਇਹ ਦੱਸਣਾ ਔਖਾ ਹੈ ਕਿ ਕੀ ਸ਼ਬਦ ਆਪਣੇ ਆਪ ਸਹੀ ਹਨ।[29]
ਖੋਜੀ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ
[ਸੋਧੋ]ਇੱਕ ਵਾਰ ਡੇਟਾਸੈੱਟਾਂ ਨੂੰ ਸਾਫ਼ ਕਰਨ ਤੋਂ ਬਾਅਦ, ਉਹਨਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਵਿਸ਼ਲੇਸ਼ਕ ਵੱਖ-ਵੱਖ ਤਕਨੀਕਾਂ ਨੂੰ ਲਾਗੂ ਕਰ ਸਕਦੇ ਹਨ, ਜਿਨ੍ਹਾਂ ਨੂੰ ਖੋਜੀ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਿਹਾ ਜਾਂਦਾ ਹੈ, ਪ੍ਰਾਪਤ ਕੀਤੇ ਡਾਟਾ ਦੇ ਅੰਦਰ ਮੌਜੂਦ ਸੰਦੇਸ਼ਾਂ ਨੂੰ ਸਮਝਣਾ ਸ਼ੁਰੂ ਕਰਨ ਲਈ।[30] ਡਾਟਾ ਖੋਜ ਦੀ ਪ੍ਰਕਿਰਿਆ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਵਾਧੂ ਡੇਟਾ ਸਫਾਈ ਜਾਂ ਡੇਟਾ ਲਈ ਵਾਧੂ ਬੇਨਤੀਆਂ ਹੋ ਸਕਦੀਆਂ ਹਨ; ਇਸ ਤਰ੍ਹਾਂ, ਇਸ ਭਾਗ ਦੇ ਲੀਡ ਪੈਰਾਗ੍ਰਾਫ ਵਿੱਚ ਜ਼ਿਕਰ ਕੀਤੇ ਦੁਹਰਾਓ ਪੜਾਵਾਂ ਦੀ ਸ਼ੁਰੂਆਤ।[31]ਵਰਣਨਯੋਗ ਅੰਕੜੇ , ਜਿਵੇਂ ਕਿ, ਔਸਤ ਜਾਂ ਮੱਧ, ਡੇਟਾ ਨੂੰ ਸਮਝਣ ਵਿੱਚ ਸਹਾਇਤਾ ਲਈ ਤਿਆਰ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ।[32] [33] ਡਾਟਾ ਵਿਜ਼ੂਅਲਾਈਜ਼ੇਸ਼ਨ ਵੀ ਵਰਤੀ ਜਾਂਦੀ ਇੱਕ ਤਕਨੀਕ ਹੈ, ਜਿਸ ਵਿੱਚ ਵਿਸ਼ਲੇਸ਼ਕ ਡਾਟਾ ਦੇ ਅੰਦਰਲੇ ਸੰਦੇਸ਼ਾਂ ਦੇ ਸਬੰਧ ਵਿੱਚ ਵਾਧੂ ਸੂਝ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਇੱਕ ਗ੍ਰਾਫਿਕਲ ਫਾਰਮੈਟ ਵਿੱਚ ਡਾਟਾ ਦੀ ਜਾਂਚ ਕਰਨ ਦੇ ਯੋਗ ਹੁੰਦਾ ਹੈ।[13]
ਮਾਡਲਿੰਗ ਅਤੇ ਐਲਗੋਰਿਦਮ
[ਸੋਧੋ]ਗਣਿਤ ਦੇ ਫਾਰਮੂਲੇ ਜਾਂ ਮਾਡਲ (ਐਲਗੋਰਿਦਮ ਵਜੋਂ ਵੀ ਜਾਣੇ ਜਾਂਦੇ ਹਨ), ਵੇਰੀਏਬਲਾਂ ਵਿਚਕਾਰ ਸਬੰਧਾਂ ਦੀ ਪਛਾਣ ਕਰਨ ਲਈ ਡਾਟਾ 'ਤੇ ਲਾਗੂ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ; ਉਦਾਹਰਨ ਲਈ, ਸਬੰਧ ਜਾਂ ਕਾਰਨ ਦੀ ਵਰਤੋਂ ਕਰਨਾ।[34][35] ਆਮ ਸ਼ਬਦਾਂ ਵਿੱਚ, ਮਾਡਲਾਂ ਨੂੰ ਲਾਗੂ ਕੀਤੇ ਮਾਡਲ ਦੀ ਸ਼ੁੱਧਤਾ (ਉਦਾਹਰਨ ਲਈ, ਡਾਟਾ = ਮਾਡਲ + ਤਰੁੱਟੀ) 'ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹੋਏ ਕੁਝ ਰਹਿੰਦ-ਖੂੰਹਦ ਗਲਤੀ ਦੇ ਨਾਲ, ਡਾਟਾਸ਼ੈਟ ਦੇ ਅੰਦਰ ਮੌਜੂਦ ਹੋਰ ਵੇਰੀਏਬਲ (ਵਾਂ) ਦੇ ਅਧਾਰ ਤੇ ਇੱਕ ਖਾਸ ਵੇਰੀਏਬਲ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਵਿਕਸਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।[36][11]
ਡਾਟਾ ਉਤਪਾਦ
[ਸੋਧੋ]ਇੱਕ ਡੇਟਾ ਉਤਪਾਦ ਇੱਕ ਕੰਪਿਊਟਰ ਐਪਲੀਕੇਸ਼ਨ ਹੈ ਜੋ ਡਾਟਾ ਇਨਪੁੱਟ ਲੈਂਦਾ ਹੈ ਅਤੇ ਆਉਟਪੁੱਟ ਤਿਆਰ ਕਰਦਾ ਹੈ, ਉਹਨਾਂ ਨੂੰ ਵਾਤਾਵਰਣ ਵਿੱਚ ਵਾਪਸ ਫੀਡ ਕਰਦਾ ਹੈ।[37] ਇਹ ਇੱਕ ਮਾਡਲ ਜਾਂ ਐਲਗੋਰਿਦਮ 'ਤੇ ਅਧਾਰਤ ਹੋ ਸਕਦਾ ਹੈ। ਉਦਾਹਰਨ ਲਈ, ਇੱਕ ਐਪਲੀਕੇਸ਼ਨ ਜੋ ਗਾਹਕ ਦੇ ਖਰੀਦ ਇਤਿਹਾਸ ਬਾਰੇ ਡੇਟਾ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਦੀ ਹੈ, ਅਤੇ ਉਹਨਾਂ ਹੋਰ ਖਰੀਦਾਂ ਦੀ ਸਿਫ਼ਾਰਸ਼ ਕਰਨ ਲਈ ਨਤੀਜਿਆਂ ਦੀ ਵਰਤੋਂ ਕਰਦੀ ਹੈ ਜੋ ਗਾਹਕ ਦਾ ਆਨੰਦ ਲੈ ਸਕਦੇ ਹਨ।[38][13]
ਸੰਚਾਰ
[ਸੋਧੋ]ਇੱਕ ਵਾਰ ਡੇਟਾ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਤੋਂ ਬਾਅਦ, ਵਿਸ਼ਲੇਸ਼ਣ ਦੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਉਹਨਾਂ ਦੀਆਂ ਲੋੜਾਂ ਦਾ ਸਮਰਥਨ ਕਰਨ ਲਈ ਕਈ ਫਾਰਮੈਟਾਂ ਵਿੱਚ ਰਿਪੋਰਟ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ।[40] ਉਪਭੋਗਤਾਵਾਂ ਕੋਲ ਫੀਡਬੈਕ ਹੁੰਦੀ ਹੈ, ਜਿਸਦਾ ਨਤੀਜਾ ਵਾਧੂ ਵਿਸ਼ਲੇਸ਼ਣ ਹੁੰਦਾ ਹੈ। ਇਸ ਤਰ੍ਹਾਂ, ਵਿਸ਼ਲੇਸ਼ਣਾਤਮਕ ਚੱਕਰ ਦਾ ਬਹੁਤਾ ਹਿੱਸਾ ਦੁਹਰਾਅ ਵਾਲਾ ਹੁੰਦਾ ਹੈ।[13]
ਨਤੀਜਿਆਂ ਦਾ ਸੰਚਾਰ ਕਿਵੇਂ ਕਰਨਾ ਹੈ ਇਹ ਨਿਰਧਾਰਿਤ ਕਰਦੇ ਸਮੇਂ, ਵਿਸ਼ਲੇਸ਼ਕ ਸੁਨੇਹੇ ਨੂੰ ਦਰਸ਼ਕਾਂ ਤੱਕ ਵਧੇਰੇ ਸਪਸ਼ਟ ਅਤੇ ਕੁਸ਼ਲਤਾ ਨਾਲ ਸੰਚਾਰ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਨ ਲਈ ਕਈ ਤਰ੍ਹਾਂ ਦੀਆਂ ਡੇਟਾ ਵਿਜ਼ੂਅਲਾਈਜ਼ੇਸ਼ਨ ਤਕਨੀਕਾਂ ਨੂੰ ਲਾਗੂ ਕਰਨ ਬਾਰੇ ਵਿਚਾਰ ਕਰ ਸਕਦਾ ਹੈ।[41] ਡੇਟਾ ਵਿਜ਼ੂਅਲਾਈਜ਼ੇਸ਼ਨ ਡੇਟਾ ਵਿੱਚ ਮੌਜੂਦ ਮੁੱਖ ਸੰਦੇਸ਼ਾਂ ਨੂੰ ਸੰਚਾਰ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਨ ਲਈ ਜਾਣਕਾਰੀ ਡਿਸਪਲੇ (ਗ੍ਰਾਫਿਕਸ ਜਿਵੇਂ ਕਿ ਟੇਬਲ ਅਤੇ ਚਾਰਟ) ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ।[42] ਟੇਬਲ ਖਾਸ ਨੰਬਰਾਂ 'ਤੇ ਸਵਾਲ ਕਰਨ ਅਤੇ ਫੋਕਸ ਕਰਨ ਦੀ ਉਪਭੋਗਤਾ ਦੀ ਯੋਗਤਾ ਨੂੰ ਸਮਰੱਥ ਬਣਾ ਕੇ ਇੱਕ ਕੀਮਤੀ ਸਾਧਨ ਹਨ; ਜਦੋਂ ਕਿ ਚਾਰਟ (ਉਦਾਹਰਨ ਲਈ, ਬਾਰ ਚਾਰਟ ਜਾਂ ਲਾਈਨ ਚਾਰਟ), ਡਾਟਾ ਵਿੱਚ ਸ਼ਾਮਲ ਮਾਤਰਾਤਮਕ ਸੰਦੇਸ਼ਾਂ ਨੂੰ ਸਮਝਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰਦੇ ਹਨ।[43]
ਮਾਤਰਾਤਮਕ ਸੁਨੇਹੇ
[ਸੋਧੋ]ਸਟੀਫਨ ਫਿਊ ਨੇ ਅੱਠ ਕਿਸਮਾਂ ਦੇ ਗਿਣਾਤਮਕ ਸੰਦੇਸ਼ਾਂ ਦਾ ਵਰਣਨ ਕੀਤਾ ਹੈ ਜੋ ਉਪਭੋਗਤਾ ਡੇਟਾ ਦੇ ਇੱਕ ਸਮੂਹ ਤੋਂ ਸਮਝਣ ਜਾਂ ਸੰਚਾਰ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਸਕਦੇ ਹਨ ਅਤੇ ਸੰਦੇਸ਼ ਨੂੰ ਸੰਚਾਰ ਕਰਨ ਵਿੱਚ ਸਹਾਇਤਾ ਲਈ ਵਰਤੇ ਜਾਂਦੇ ਗ੍ਰਾਫਾਂ ਨਾਲ ਜੁੜੇ ਹੋਏ ਹਨ।[44] ਲੋੜਾਂ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਨ ਵਾਲੇ ਗਾਹਕ ਅਤੇ ਡੇਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਵਾਲੇ ਵਿਸ਼ਲੇਸ਼ਕ ਪ੍ਰਕਿਰਿਆ ਦੇ ਦੌਰਾਨ ਇਹਨਾਂ ਸੰਦੇਸ਼ਾਂ 'ਤੇ ਵਿਚਾਰ ਕਰ ਸਕਦੇ ਹਨ।[45]
- ਸਮਾਂ-ਸੀਰੀਜ਼: ਇੱਕ ਸਿੰਗਲ ਵੇਰੀਏਬਲ ਨੂੰ ਸਮੇਂ ਦੀ ਮਿਆਦ ਵਿੱਚ ਕੈਪਚਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ 10-ਸਾਲ ਦੀ ਮਿਆਦ ਵਿੱਚ ਬੇਰੁਜ਼ਗਾਰੀ ਦੀ ਦਰ। ਰੁਝਾਨ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਨ ਲਈ ਇੱਕ ਲਾਈਨ ਚਾਰਟ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ।[46]
- ਦਰਜਾਬੰਦੀ: ਸ਼੍ਰੇਣੀਬੱਧ ਉਪ-ਵਿਭਾਗਾਂ ਨੂੰ ਵੱਧਦੇ ਜਾਂ ਘਟਦੇ ਕ੍ਰਮ ਵਿੱਚ ਦਰਜਾ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਇੱਕ ਮਿਆਦ ਦੇ ਦੌਰਾਨ ਸੇਲਜ਼ਪਰਸਨ ਦੁਆਰਾ ਵਿਕਰੀ ਪ੍ਰਦਰਸ਼ਨ (ਮਾਪ) ਦੀ ਦਰਜਾਬੰਦੀ (ਸ਼੍ਰੇਣੀ, ਹਰੇਕ ਸੇਲਜ਼ਪਰਸਨ ਦੇ ਨਾਲ ਇੱਕ ਸ਼੍ਰੇਣੀਬੱਧ ਉਪ-ਵਿਭਾਗ)।[47] ਇੱਕ ਬਾਰ ਚਾਰਟ ਦੀ ਵਰਤੋਂ ਵਿਕਰੇਤਾਵਾਂ ਵਿੱਚ ਤੁਲਨਾ ਦਿਖਾਉਣ ਲਈ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ।[48]
- ਭਾਗ-ਤੋਂ-ਪੂਰੇ: ਸ਼੍ਰੇਣੀਬੱਧ ਉਪ-ਵਿਭਾਗਾਂ ਨੂੰ ਪੂਰੇ ਦੇ ਅਨੁਪਾਤ ਵਜੋਂ ਮਾਪਿਆ ਜਾਂਦਾ ਹੈ (ਅਰਥਾਤ, 100% ਵਿੱਚੋਂ ਇੱਕ ਪ੍ਰਤੀਸ਼ਤ)। ਇੱਕ ਪਾਈ ਚਾਰਟ ਜਾਂ ਬਾਰ ਚਾਰਟ ਅਨੁਪਾਤ ਦੀ ਤੁਲਨਾ ਦਿਖਾ ਸਕਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਇੱਕ ਮਾਰਕੀਟ ਵਿੱਚ ਪ੍ਰਤੀਯੋਗੀਆਂ ਦੁਆਰਾ ਪ੍ਰਸਤੁਤ ਮਾਰਕੀਟ ਸ਼ੇਅਰ।[49]
- ਵਿਵਹਾਰ: ਸ਼੍ਰੇਣੀਬੱਧ ਉਪ-ਵਿਭਾਜਨਾਂ ਦੀ ਤੁਲਨਾ ਇੱਕ ਸੰਦਰਭ ਦੇ ਨਾਲ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਜਿਵੇਂ ਕਿ ਇੱਕ ਦਿੱਤੇ ਸਮੇਂ ਦੀ ਮਿਆਦ ਲਈ ਕਿਸੇ ਕਾਰੋਬਾਰ ਦੇ ਕਈ ਵਿਭਾਗਾਂ ਲਈ ਅਸਲ ਬਨਾਮ ਬਜਟ ਖਰਚਿਆਂ ਦੀ ਤੁਲਨਾ। ਇੱਕ ਬਾਰ ਚਾਰਟ ਅਸਲ ਬਨਾਮ ਸੰਦਰਭ ਰਕਮ ਦੀ ਤੁਲਨਾ ਦਿਖਾ ਸਕਦਾ ਹੈ। ਫ੍ਰੀਕੁਐਂਸੀ ਡਿਸਟ੍ਰੀਬਿਊਸ਼ਨ: ਦਿੱਤੇ ਗਏ ਅੰਤਰਾਲ ਲਈ ਕਿਸੇ ਖਾਸ ਵੇਰੀਏਬਲ ਦੇ ਨਿਰੀਖਣਾਂ ਦੀ ਸੰਖਿਆ ਦਿਖਾਉਂਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਸਾਲਾਂ ਦੀ ਸੰਖਿਆ ਜਿਸ ਵਿੱਚ ਸਟਾਕ ਮਾਰਕੀਟ ਰਿਟਰਨ ਅੰਤਰਾਲਾਂ ਦੇ ਵਿਚਕਾਰ ਹੈ ਜਿਵੇਂ ਕਿ 0-10%, 11-20%, ਆਦਿ। ਇੱਕ ਹਿਸਟੋਗ੍ਰਾਮ, ਇੱਕ ਬਾਰ ਚਾਰਟ ਦੀ ਕਿਸਮ, ਇਸ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਵਰਤੀ ਜਾ ਸਕਦੀ ਹੈ।[50]
- ਸਬੰਧ: ਦੋ ਵੇਰੀਏਬਲਾਂ (X,Y) ਦੁਆਰਾ ਦਰਸਾਏ ਗਏ ਨਿਰੀਖਣਾਂ ਵਿਚਕਾਰ ਤੁਲਨਾ ਇਹ ਨਿਰਧਾਰਤ ਕਰਨ ਲਈ ਕਿ ਕੀ ਉਹ ਇੱਕੋ ਜਾਂ ਉਲਟ ਦਿਸ਼ਾਵਾਂ ਵਿੱਚ ਜਾਂਦੇ ਹਨ। ਉਦਾਹਰਨ ਲਈ, ਮਹੀਨਿਆਂ ਦੇ ਨਮੂਨੇ ਲਈ ਬੇਰੋਜ਼ਗਾਰੀ (X) ਅਤੇ ਮਹਿੰਗਾਈ (Y) ਦੀ ਸਾਜ਼ਿਸ਼ ਕਰਨਾ। ਇੱਕ ਸਕੈਟਰ ਪਲਾਟ ਆਮ ਤੌਰ 'ਤੇ ਇਸ ਸੰਦੇਸ਼ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ। ਨਾਮਾਤਰ ਤੁਲਨਾ: ਕਿਸੇ ਖਾਸ ਕ੍ਰਮ ਵਿੱਚ ਸ਼੍ਰੇਣੀਬੱਧ ਉਪ-ਵਿਭਾਜਨਾਂ ਦੀ ਤੁਲਨਾ ਕਰਨਾ, ਜਿਵੇਂ ਕਿ ਉਤਪਾਦ ਕੋਡ ਦੁਆਰਾ ਵਿਕਰੀ ਵਾਲੀਅਮ। ਇਸ ਤੁਲਨਾ ਲਈ ਇੱਕ ਬਾਰ ਚਾਰਟ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਭੂਗੋਲਿਕ ਜਾਂ ਭੂ-ਸਥਾਨਕ: ਇੱਕ ਨਕਸ਼ੇ ਜਾਂ ਲੇਆਉਟ ਵਿੱਚ ਇੱਕ ਵੇਰੀਏਬਲ ਦੀ ਤੁਲਨਾ, ਜਿਵੇਂ ਕਿ ਰਾਜ ਦੁਆਰਾ ਬੇਰੁਜ਼ਗਾਰੀ ਦਰ ਜਾਂ ਕਿਸੇ ਇਮਾਰਤ ਦੀਆਂ ਵੱਖ-ਵੱਖ ਮੰਜ਼ਿਲਾਂ 'ਤੇ ਵਿਅਕਤੀਆਂ ਦੀ ਗਿਣਤੀ। ਇੱਕ ਕਾਰਟੋਗਰਾਮ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਇੱਕ ਆਮ ਗ੍ਰਾਫਿਕ ਹੁੰਦਾ ਹੈ।
ਹਵਾਲੇ
[ਸੋਧੋ]- ↑ 1.0 1.1 "Transforming Unstructured Data into Useful Information", Big Data, Mining, and Analytics, Auerbach Publications, pp. 227–246, 2014-03-12, doi:10.1201/b16666-14, ISBN 978-0-429-09529-0, retrieved 2021-05-29
- ↑ "The Multiple Facets of Correlation Functions", Data Analysis Techniques for Physical Scientists, Cambridge University Press, pp. 526–576, 2017, doi:10.1017/9781108241922.013, ISBN 978-1-108-41678-8, retrieved 2021-05-29
- ↑ Xia, B. S., & Gong, P. (2015). Review of business intelligence through data analysis. Benchmarking, 21(2), 300-311. doi:10.1108/BIJ-08-2012-0050
- ↑ Exploring Data Analysis
- ↑ "Data Coding and Exploratory Analysis (EDA) Rules for Data Coding Exploratory Data Analysis (EDA) Statistical Assumptions", SPSS for Intermediate Statistics, Routledge, pp. 42–67, 2004-08-16, doi:10.4324/9781410611420-6, ISBN 978-1-4106-1142-0, retrieved 2021-05-29
- ↑ Spie (2014-10-01). "New European ICT call focuses on PICs, lasers, data transfer". SPIE Professional. doi:10.1117/2.4201410.10. ISSN 1994-4403.
- ↑ Samandar, Petersson; Svantesson, Sofia (2017). Skapandet av förtroende inom eWOM : En studie av profilbildens effekt ur ett könsperspektiv. Högskolan i Gävle, Företagsekonomi. OCLC 1233454128.
- ↑ Goodnight, James (2011-01-13). "The forecast for predictive analytics: hot and getting hotter". Statistical Analysis and Data Mining: The ASA Data Science Journal. 4 (1): 9–10. doi:10.1002/sam.10106. ISSN 1932-1864.
- ↑ Sherman, Rick (4 November 2014). Business intelligence guidebook: from data integration to analytics. Amsterdam. ISBN 978-0-12-411528-6. OCLC 894555128.
{{cite book}}
: CS1 maint: location missing publisher (link) - ↑ Field, John (2009), "Dividing listening into its components", Listening in the Language Classroom, Cambridge: Cambridge University Press, pp. 96–109, doi:10.1017/cbo9780511575945.008, ISBN 978-0-511-57594-5, retrieved 2021-05-29
- ↑ 11.0 11.1 Judd, Charles; McCleland, Gary (1989). Data Analysis. Harcourt Brace Jovanovich. ISBN 0-15-516765-0.
- ↑ John Tukey-The Future of Data Analysis-July 1961
- ↑ 13.0 13.1 13.2 13.3 13.4 13.5 13.6 Schutt, Rachel; O'Neil, Cathy (2013). Doing Data Science. O'Reilly Media. ISBN 978-1-449-35865-5.
- ↑ "USE OF THE DATA", Handbook of Petroleum Product Analysis, Hoboken, NJ: John Wiley & Sons, Inc, pp. 296–303, 2015-02-06, doi:10.1002/9781118986370.ch18, ISBN 978-1-118-98637-0, retrieved 2021-05-29
- ↑ Ainsworth, Penne (20 May 2019). Introduction to accounting : an integrated approach. ISBN 978-1-119-60014-5. OCLC 1097366032.
- ↑ Margo, Robert A. (2000). Wages and labor markets in the United States, 1820-1860. University of Chicago Press. ISBN 0-226-50507-3. OCLC 41285104.
- ↑ Olusola, Johnson Adedeji; Shote, Adebola Adekunle; Ouigmane, Abdellah; Isaifan, Rima J. (7 May 2021). "Table 1: Data type and sources of data collected for this research". PeerJ. 9: e11387. doi:10.7717/peerj.11387/table-1. Retrieved 2021-05-29.
{{cite journal}}
: CS1 maint: unflagged free DOI (link) - ↑ MacPherson, Derek (2019-10-16), "Information Technology Analysts' Perspectives", Data Strategy in Colleges and Universities, Routledge, pp. 168–183, doi:10.4324/9780429437564-12, ISBN 978-0-429-43756-4, retrieved 2021-05-29
- ↑ Nelson, Stephen L. (2014). Excel data analysis for dummies. Wiley. ISBN 978-1-118-89810-9. OCLC 877772392.
- ↑ "Figure 3—source data 1. Raw and processed values obtained through qPCR". 30 August 2017. doi:10.7554/elife.28468.029. Retrieved 2021-05-29.
{{cite journal}}
: Cite journal requires|journal=
(help)CS1 maint: unflagged free DOI (link) - ↑ 21.0 21.1 Bohannon, John (2016-02-24). "Many surveys, about one in five, may contain fraudulent data". Science. doi:10.1126/science.aaf4104. ISSN 0036-8075.
- ↑ Jeannie Scruggs, Garber; Gross, Monty; Slonim, Anthony D. (2010). Avoiding common nursing errors. Wolters Kluwer Health/Lippincott Williams & Wilkins. ISBN 978-1-60547-087-0. OCLC 338288678.
- ↑ "Data Cleaning". Microsoft Research. Retrieved 26 October 2013.
- ↑ Hancock, R.G.V.; Carter, Tristan (February 2010). "How reliable are our published archaeometric analyses? Effects of analytical techniques through time on the elemental analysis of obsidians". Journal of Archaeological Science. 37 (2): 243–250. doi:10.1016/j.jas.2009.10.004. ISSN 0305-4403.
- ↑ Perceptual Edge-Jonathan Koomey-Best practices for understanding quantitative data-February 14, 2006
- ↑ Peleg, Roni; Avdalimov, Angelika; Freud, Tamar (2011-03-23). "Providing cell phone numbers and email addresses to Patients: the physician's perspective". BMC Research Notes. 4 (1): 76. doi:10.1186/1756-0500-4-76. ISSN 1756-0500. PMC 3076270. PMID 21426591.
{{cite journal}}
: CS1 maint: unflagged free DOI (link) - ↑ Goodman, Lenn Evan (1998). Judaism, human rights, and human values. Oxford University Press. ISBN 0-585-24568-1. OCLC 45733915.
- ↑ Hanzo, Lajos. "Blind joint maximum likelihood channel estimation and data detection for single-input multiple-output systems". doi:10.1049/iet-tv.44.786. Retrieved 2021-05-29.
{{cite journal}}
: Cite journal requires|journal=
(help) - ↑ Hellerstein, Joseph (27 February 2008). "Quantitative Data Cleaning for Large Databases" (PDF). EECS Computer Science Division: 3. Retrieved 26 October 2013.
- ↑ Davis, Steve; Pettengill, James B.; Luo, Yan; Payne, Justin; Shpuntoff, Al; Rand, Hugh; Strain, Errol (26 August 2015). "CFSAN SNP Pipeline: An automated method for constructing SNP matrices from next-generation sequence data". PeerJ Computer Science. 1: e20. doi:10.7717/peerj-cs.20/supp-1. Retrieved 2021-05-31.
{{cite journal}}
: CS1 maint: unflagged free DOI (link) - ↑ "FTC requests additional data". Pump Industry Analyst. 1999 (48): 12. December 1999. doi:10.1016/s1359-6128(99)90509-8. ISSN 1359-6128.
- ↑ "Exploring your Data with Data Visualization & Descriptive Statistics: Common Descriptive Statistics for Quantitative Data". 2017. doi:10.4135/9781529732795.
{{cite journal}}
: Cite journal requires|journal=
(help) - ↑ Murray, Daniel G. (2013). Tableau your data! : fast and easy visual analysis with Tableau Software. J. Wiley & Sons. ISBN 978-1-118-61204-0. OCLC 873810654.
- ↑ Ben-Ari, Mordechai (2012), "First-Order Logic: Formulas, Models, Tableaux", Mathematical Logic for Computer Science, London: Springer London, pp. 131–154, doi:10.1007/978-1-4471-4129-7_7, ISBN 978-1-4471-4128-0, retrieved 2021-05-31
- ↑ Sosa, Ernest (2011). Causation. Oxford Univ. Press. ISBN 978-0-19-875094-9. OCLC 767569031.
- ↑ Evans, Michelle V.; Dallas, Tad A.; Han, Barbara A.; Murdock, Courtney C.; Drake, John M. (28 February 2017). "Figure 2. Variable importance by permutation, averaged over 25 models". eLife. 6: e22053. doi:10.7554/elife.22053.004. Retrieved 2021-05-31.
{{cite journal}}
: CS1 maint: unflagged free DOI (link) - ↑ Conway, Steve (2012-07-04). "A Cautionary Note on Data Inputs and Visual Outputs in Social Network Analysis". British Journal of Management. 25 (1): 102–117. doi:10.1111/j.1467-8551.2012.00835.x. ISSN 1045-3172.
- ↑ "Customer Purchases and Other Repeated Events", Data Analysis Using SQL and Excel®, Indianapolis, Indiana: John Wiley & Sons, Inc., pp. 367–420, 2016-01-29, doi:10.1002/9781119183419.ch8, ISBN 978-1-119-18341-9, retrieved 2021-05-31
- ↑ Grandjean, Martin (2014). "La connaissance est un réseau" (PDF). Les Cahiers du Numérique. 10 (3): 37–54. doi:10.3166/lcn.10.3.37-54.
- ↑ Data requirements for semiconductor die. Exchange data formats and data dictionary, BSI British Standards, doi:10.3403/02271298, retrieved 2021-05-31
- ↑ Yee, D. (1985-04-01). "How to Communicate Your Message to an Audience Effectively". The Gerontologist. 25 (2): 209. doi:10.1093/geront/25.2.209. ISSN 0016-9013.
- ↑ Bemowska-Kałabun, Olga; Wąsowicz, Paweł; Napora-Rutkowski, Łukasz; Nowak-Życzyńska, Zuzanna; Wierzbicka, Małgorzata (11 June 2019). "Supplemental Information 1: Raw data for charts and tables". doi:10.7287/peerj.preprints.27793v1/supp-1. Retrieved 2021-05-31.
{{cite journal}}
: Cite journal requires|journal=
(help)CS1 maint: unflagged free DOI (link) - ↑ Visualizing Data About UK Museums: Bar Charts, Line Charts and Heat Maps. 2021. doi:10.4135/9781529768749. ISBN 9781529768749.
- ↑ Tunqui Neira, José Manuel (2019-09-19). "Thank you for your review. Please find in the attached pdf file a detailed response to the points you raised". doi:10.5194/hess-2019-325-ac2. Retrieved 2021-06-01.
{{cite journal}}
: Cite journal requires|journal=
(help)CS1 maint: unflagged free DOI (link) - ↑ Brackett, John W. (1989), "Performing Requirements Analysis Project Courses for External Customers", Issues in Software Engineering Education, New York, NY: Springer New York, pp. 276–285, doi:10.1007/978-1-4613-9614-7_20, ISBN 978-1-4613-9616-1, retrieved 2021-06-03
- ↑ Wyckhuys, Kris A. G.; Wongtiem, Prapit; Rauf, Aunu; Thancharoen, Anchana; Heimpel, George E.; Le, Nhung T. T.; Fanani, Muhammad Zainal; Gurr, Geoff M.; Lundgren, Jonathan G. (19 October 2018). "Figure 2: Bi-monthly mealybug population fluctuations in southern Vietnam, over a 2-year time period". PeerJ. 6: e5796. doi:10.7717/peerj.5796/fig-2. Retrieved 2021-06-03.
{{cite journal}}
: CS1 maint: unflagged free DOI (link) - ↑ Riehl, Emily (2014), "A sampling of 2-categorical aspects of quasi-category theory", Categorical Homotopy Theory, Cambridge: Cambridge University Press, pp. 318–336, doi:10.1017/cbo9781107261457.019, ISBN 978-1-107-26145-7, retrieved 2021-06-03
- ↑ "X-BAR CHART", SpringerReference, Berlin/Heidelberg: Springer-Verlag, 2011, doi:10.1007/springerreference_7402, retrieved 2021-06-03
- ↑ "Chart C5.3. Percentage of 15-19 year-olds not in education, by labour market status (2012)". doi:10.1787/888933119055. Retrieved 2021-06-03.
{{cite journal}}
: Cite journal requires|journal=
(help) - ↑ Chao, Luke H.; Jang, Jaebong; Johnson, Adam; Nguyen, Anthony; Gray, Nathanael S.; Yang, Priscilla L.; Harrison, Stephen C. (12 July 2018). Schekman, Randy (ed.). "Figure 4. Frequency of hemifusion (measured as DiD fluorescence dequenching) as a function of number of bound Alexa-fluor-555/3-110-22 molecules". eLife. 7: e36461. doi:10.7554/elife.36461.006. Retrieved 2021-06-03.
{{cite journal}}
: Missing|editor1=
(help)CS1 maint: unflagged free DOI (link)