ਡਾਟਾ ਸਾਇੰਸ

ਵਿਕੀਪੀਡੀਆ, ਇੱਕ ਅਜ਼ਾਦ ਗਿਆਨਕੋਸ਼ ਤੋਂ

ਡਾਟਾ ਸਾਇੰਸ ਇੱਕ ਅੰਤਰ-ਅਨੁਸ਼ਾਸਨੀ ਅਕਾਦਮਿਕ ਖੇਤਰ ਹੈ।[1]ਜੋ ਸੰਭਾਵੀ ਤੌਰ 'ਤੇ ਢਾਂਚਾਗਤ, ਜਾਂ ਗੈਰ-ਸੰਗਠਿਤ ਡਾਟਾ ਤੋਂ ਗਿਆਨ ਅਤੇ ਸੂਝ ਨੂੰ ਐਕਸਟਰੈਕਟ ਕਰਨ ਲਈ ਅੰਕੜੇ, ਵਿਗਿਆਨਕ ਕੰਪਿਊਟਿੰਗ, ਵਿਗਿਆਨਕ ਵਿਧੀਆਂ, ਪ੍ਰਕਿਰਿਆਵਾਂ, ਐਲਗੋਰਿਦਮ ਅਤੇ ਪ੍ਰਣਾਲੀਆਂ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ।[2]

ਡਾਟਾ ਸਾਇੰਸ ਅੰਡਰਲਾਈੰਗ ਐਪਲੀਕੇਸ਼ਨ ਡੋਮੇਨ (ਉਦਾਹਰਨ ਲਈ ਕੁਦਰਤੀ ਵਿਗਿਆਨ, ਸੂਚਨਾ ਤਕਨਾਲੋਜੀ, ਅਤੇ ਦਵਾਈ) ਤੋਂ ਡੋਮੇਨ ਗਿਆਨ ਨੂੰ ਵੀ ਏਕੀਕ੍ਰਿਤ ਕਰਦਾ ਹੈ। ਡਾਟਾ ਸਾਇੰਸ ਬਹੁਪੱਖੀ ਹੈ ਅਤੇ ਇਸਨੂੰ ਵਿਗਿਆਨ, ਖੋਜ ਪੈਰਾਡਾਈਮ, ਖੋਜ ਵਿਧੀ, ਅਨੁਸ਼ਾਸਨ, ਵਰਕਫਲੋ, ਅਤੇ ਇੱਕ ਪੇਸ਼ੇ ਵਜੋਂ ਦਰਸਾਇਆ ਜਾ ਸਕਦਾ ਹੈ।

ਡਾਟਾ ਵਿਗਿਆਨ ਡਾਟਾ ਦੇ ਨਾਲ "ਅਸਲ ਵਰਤਾਰੇ ਨੂੰ ਸਮਝਣ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣ" ਕਰਨ ਲਈ "ਅੰਕੜੇ, ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ, ਸੂਚਨਾ ਵਿਗਿਆਨ, ਅਤੇ ਉਹਨਾਂ ਨਾਲ ਸਬੰਧਤ ਤਰੀਕਿਆਂ ਨੂੰ ਏਕੀਕ੍ਰਿਤ ਕਰਨ ਦੀ ਧਾਰਨਾ" ਹੈ। ਇਹ ਗਣਿਤ, ਅੰਕੜੇ, ਕੰਪਿਊਟਰ ਵਿਗਿਆਨ, ਸੂਚਨਾ ਵਿਗਿਆਨ, ਅਤੇ ਡੋਮੇਨ ਗਿਆਨ ਦੇ ਸੰਦਰਭ ਵਿੱਚ ਕਈ ਖੇਤਰਾਂ ਤੋਂ ਖਿੱਚੀਆਂ ਗਈਆਂ ਤਕਨੀਕਾਂ ਅਤੇ ਸਿਧਾਂਤਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਹਾਲਾਂਕਿ, ਡਾਟਾ ਸਾਇੰਸ, ਕੰਪਿਊਟਰ ਵਿਗਿਆਨ ਅਤੇ ਸੂਚਨਾ ਵਿਗਿਆਨ ਤੋਂ ਵੱਖਰਾ ਹੈ। ਟਿਊਰਿੰਗ ਅਵਾਰਡ ਜੇਤੂ ਜਿਮ ਗ੍ਰੇ ਨੇ ਡਾਟਾ ਸਾਇੰਸ ਨੂੰ ਵਿਗਿਆਨ ਦੇ "ਚੌਥੇ ਪੈਰਾਡਾਈਮ" (ਪ੍ਰਯੋਗਿਕ, ਸਿਧਾਂਤਕ, ਕੰਪਿਊਟੇਸ਼ਨਲ, ਅਤੇ ਡਾਟਾ ਦੁਆਰਾ ਸੰਚਾਲਿਤ) ਵਜੋਂ ਕਲਪਨਾ ਕੀਤੀ ਅਤੇ ਜ਼ੋਰ ਦੇ ਕੇ ਕਿਹਾ ਕਿ "ਵਿਗਿਆਨ ਬਾਰੇ ਸਭ ਕੁਝ ਸੂਚਨਾ ਤਕਨਾਲੋਜੀ ਤੇ ਡਾਟਾ ਦੇ ਪ੍ਰਸਾਰ ਦੇ ਪ੍ਰਭਾਵ ਕਾਰਨ ਬਦਲ ਰਿਹਾ ਹੈ।

ਇੱਕ ਡਾਟਾ ਵਿਗਿਆਨੀ ਇੱਕ ਪੇਸ਼ੇਵਰ ਹੁੰਦਾ ਹੈ, ਜੋ ਪ੍ਰੋਗਰਾਮਿੰਗ ਕੋਡ ਬਣਾਉਂਦਾ ਹੈ ਅਤੇ ਡਾਟਾ ਤੋਂ ਸੂਝ ਬਣਾਉਣ ਲਈ ਇਸਨੂੰ ਅੰਕੜਾ ਗਿਆਨ ਨਾਲ ਜੋੜਦਾ ਹੈ।[3]

ਬੁਨਿਆਦ[ਸੋਧੋ]

ਡਾਟਾ ਸਾਇੰਸ ਇੱਕ ਅੰਤਰ-ਅਨੁਸ਼ਾਸਨੀ ਖੇਤਰ ਹੈ,ਜੋ ਆਮ ਤੌਰ 'ਤੇ ਵੱਡੇ ਡਾਟਾ ਸੈੱਟਾਂ ਤੋਂ ਗਿਆਨ ਨੂੰ ਕੱਢਣ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਡੋਮੇਨਾਂ ਦੀ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਉਸ ਡਾਟਾ ਤੋਂ ਗਿਆਨ ਅਤੇ ਸੂਝ ਨੂੰ ਲਾਗੂ ਕਰਨ 'ਤੇ ਕੇਂਦਰਿਤ ਹੈ। ਖੇਤਰ ਵਿੱਚ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਡਾਟਾ ਤਿਆਰ ਕਰਨਾ, ਡਾਟਾ ਸਾਇੰਸ ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਤਿਆਰ ਕਰਨਾ, ਡਾਟਾ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨਾ, ਡਾਟਾ-ਸੰਚਾਲਿਤ ਹੱਲ ਵਿਕਸਿਤ ਕਰਨਾ, ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਡੋਮੇਨਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਉੱਚ-ਪੱਧਰੀ ਫੈਸਲਿਆਂ ਨੂੰ ਸੂਚਿਤ ਕਰਨ ਲਈ ਖੋਜਾਂ ਨੂੰ ਪੇਸ਼ ਕਰਨਾ ਸ਼ਾਮਲ ਹੈ। ਜਿਵੇਂ ਕਿ ਇਸ ਵਿੱਚ ਕੰਪਿਊਟਰ ਵਿਗਿਆਨ, ਅੰਕੜੇ, ਸੂਚਨਾ ਵਿਗਿਆਨ, ਗਣਿਤ, ਡਾਟਾ ਵਿਜ਼ੂਅਲਾਈਜ਼ੇਸ਼ਨ, ਸੂਚਨਾ ਵਿਜ਼ੂਅਲਾਈਜ਼ੇਸ਼ਨ, ਡਾਟਾ ਸੋਨੀਫਿਕੇਸ਼ਨ, ਡਾਟਾ ਏਕੀਕਰਣ, ਗ੍ਰਾਫਿਕ ਡਿਜ਼ਾਈਨ, ਗੁੰਝਲਦਾਰ ਪ੍ਰਣਾਲੀਆਂ, ਸੰਚਾਰ ਅਤੇ ਕਾਰੋਬਾਰ ਦੇ ਹੁਨਰ ਸ਼ਾਮਲ ਹਨ।[4] [5]ਅੰਕੜਾ ਵਿਗਿਆਨੀ ਨਾਥਨ ਯਾਊ, ਬੈਨ ਫਰਾਈ 'ਤੇ ਡਰਾਇੰਗ ਕਰਦੇ ਹੋਏ, ਡਾਟਾ ਸਾਇੰਸ ਨੂੰ ਮਨੁੱਖੀ-ਕੰਪਿਊਟਰ ਆਪਸੀ ਤਾਲਮੇਲ ਨਾਲ ਵੀ ਜੋੜਦਾ ਹੈ: ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਅਨੁਭਵੀ ਤੌਰ 'ਤੇ ਡਾਟਾ ਕੰਟਰੋਲ ਅਤੇ ਖੋਜ ਕਰਨ ਦੇ ਯੋਗ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ।[6] 2015 ਵਿੱਚ, ਅਮਰੀਕਨ ਸਟੈਟਿਸਟੀਕਲ ਐਸੋਸੀਏਸ਼ਨ ਨੇ ਡਾਟਾਬੇਸ ਪ੍ਰਬੰਧਨ, ਅੰਕੜੇ ਅਤੇ ਮਸ਼ੀਨ ਸਿਖਲਾਈ, ਅਤੇ ਵੰਡੇ ਅਤੇ ਸਮਾਨਾਂਤਰ ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਤਿੰਨ ਉੱਭਰ ਰਹੇ ਬੁਨਿਆਦੀ ਪੇਸ਼ੇਵਰ ਭਾਈਚਾਰਿਆਂ ਵਜੋਂ ਪਛਾਣਿਆ।[7]

ਅੰਕੜਿਆਂ ਨਾਲ ਸਬੰਧ[ਸੋਧੋ]

ਨੈਟ ਸਿਲਵਰ ਸਮੇਤ ਬਹੁਤ ਸਾਰੇ ਅੰਕੜਾ ਵਿਗਿਆਨੀਆਂ ਨੇ ਦਲੀਲ ਦਿੱਤੀ ਹੈ, ਕਿ ਡਾਟਾ ਸਾਇੰਸ ਕੋਈ ਨਵਾਂ ਖੇਤਰ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਅੰਕੜਿਆਂ ਦਾ ਦੂਜਾ ਨਾਮ ਹੈ। ਦੂਸਰੇ ਦਲੀਲ ਦਿੰਦੇ ਹਨ ਕਿ ਡਾਟਾ ਸਾਇੰਸ ਅੰਕੜਿਆਂ ਤੋਂ ਵੱਖਰਾ ਹੈ ਕਿਉਂਕਿ ਇਹ ਡਿਜੀਟਲ ਡਾਟਾ ਲਈ ਵਿਲੱਖਣ ਸਮੱਸਿਆਵਾਂ ਅਤੇ ਤਕਨੀਕਾਂ 'ਤੇ ਕੇਂਦਰਿਤ ਹੈ।[8] ਵਸੰਤ ਧਰ ਲਿਖਦੇ ਹਨ ਕਿ ਅੰਕੜੇ ਮਾਤਰਾਤਮਕ ਡਾਟਾ ਅਤੇ ਵਰਣਨ ਉੱਤੇ ਜ਼ੋਰ ਦਿੰਦੇ ਹਨ। ਇਸਦੇ ਉਲਟ, ਡਾਟਾ ਸਾਇੰਸ ਮਾਤਰਾਤਮਕ ਅਤੇ ਗੁਣਾਤਮਕ ਡਾਟਾ (ਉਦਾਹਰਨ ਲਈ, ਚਿੱਤਰ, ਟੈਕਸਟ, ਸੈਂਸਰ, ਲੈਣ-ਦੇਣ, ਗਾਹਕ ਜਾਣਕਾਰੀ, ਆਦਿ) ਨਾਲ ਸੰਬੰਧਿਤ ਹੈ ਅਤੇ ਪੂਰਵ-ਅਨੁਮਾਨ ਅਤੇ ਕਾਰਵਾਈ 'ਤੇ ਜ਼ੋਰ ਦਿੰਦਾ ਹੈ।ਕੋਲੰਬੀਆ ਯੂਨੀਵਰਸਿਟੀ ਦੇ ਐਂਡਰਿਊ ਗੇਲਮੈਨ ਨੇ ਅੰਕੜਿਆਂ ਨੂੰ ਡਾਟਾ ਵਿਗਿਆਨ ਦਾ ਗੈਰ-ਜ਼ਰੂਰੀ ਹਿੱਸਾ ਦੱਸਿਆ ਹੈ।[9]

ਸਟੈਨਫੋਰਡ ਦੇ ਪ੍ਰੋਫੈਸਰ ਡੇਵਿਡ ਡੋਨੋਹੋ ਲਿਖਦੇ ਹਨ ਕਿ ਡਾਟਾ ਸਾਇੰਸ ਨੂੰ ਡੇਟਾਸੈਟਾਂ ਦੇ ਆਕਾਰ ਜਾਂ ਕੰਪਿਊਟਿੰਗ ਦੀ ਵਰਤੋਂ ਦੁਆਰਾ ਅੰਕੜਿਆਂ ਤੋਂ ਵੱਖਰਾ ਨਹੀਂ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਅਤੇ ਇਹ ਕਿ ਬਹੁਤ ਸਾਰੇ ਗ੍ਰੈਜੂਏਟ ਪ੍ਰੋਗਰਾਮ ਡਾਟਾ-ਸਾਇੰਸ ਪ੍ਰੋਗਰਾਮ ਦੇ ਸਾਰ ਵਜੋਂ ਆਪਣੇ ਵਿਸ਼ਲੇਸ਼ਣ ਅਤੇ ਅੰਕੜਾ ਸਿਖਲਾਈ ਨੂੰ ਗੁੰਮਰਾਹਕੁੰਨ ਢੰਗ ਨਾਲ ਇਸ਼ਤਿਹਾਰ ਦਿੰਦੇ ਹਨ। ਉਹ ਡਾਟਾ ਸਾਇੰਸ ਨੂੰ ਰਵਾਇਤੀ ਅੰਕੜਿਆਂ ਤੋਂ ਬਾਹਰ ਵਧਣ ਵਾਲੇ ਇੱਕ ਲਾਗੂ ਖੇਤਰ ਵਜੋਂ ਦਰਸਾਉਂਦਾ ਹੈ।

ਡਾਟਾ ਸਾਇੰਸ ਅਤੇ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ[ਸੋਧੋ]

ਡਾਟਾ ਸਾਇੰਸ ਅਤੇ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਦੋਵੇਂ ਡਾਟਾ ਪ੍ਰਬੰਧਨ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣ ਦੇ ਖੇਤਰ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਰੋਲ ਅਦਾ ਕਰਦੇ ਹਨ, ਪਰ ਇਹ ਕਈ ਮੁੱਖ ਤਰੀਕਿਆਂ ਨਾਲ ਵੱਖਰੇ ਹਨ। ਜਿਵੇਂ ਕਿ ਦੋਵੇਂ ਖੇਤਰਾਂ ਵਿੱਚ ਡਾਟਾ ਦੇ ਨਾਲ ਕੰਮ ਕਰਨਾ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ, ਡਾਟਾ ਸਾਇੰਸ ਇੱਕ ਅੰਤਰ-ਅਨੁਸ਼ਾਸਨੀ ਖੇਤਰ ਹੈ ਜਿਸ ਵਿੱਚ ਅੰਕੜਾ, ਕੰਪਿਊਟੇਸ਼ਨਲ, ਅਤੇ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਦੇ ਤਰੀਕਿਆਂ ਦੀ ਵਰਤੋਂ ਸ਼ਾਮਲ ਹੁੰਦੀ ਹੈ ਤਾਂ ਜੋ ਡਾਟਾ ਤੋਂ ਸੂਝ ਕੱਢਣ ਅਤੇ ਭਵਿੱਖਬਾਣੀ ਕੀਤੀ ਜਾ ਸਕੇ, ਜਦੋਂ ਕਿ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਪ੍ਰੀਖਿਆ ਅਤੇ ਵਿਆਖਿਆ ਪੈਟਰਨਾਂ ਅਤੇ ਰੁਝਾਨਾਂ ਦੀ ਪਛਾਣ ਕਰਨ ਲਈ 'ਤੇ ਵਧੇਰੇ ਕੇਂਦ੍ਰਿਤ ਹੁੰਦਾ ਹੈ।

ਹਵਾਲੇ[ਸੋਧੋ]

  1. Donoho, David (2017-10-02). "50 Years of Data Science". Journal of Computational and Graphical Statistics (in ਅੰਗਰੇਜ਼ੀ). 26 (4): 745–766. doi:10.1080/10618600.2017.1384734. ISSN 1061-8600.
  2. Dhar, Vasant. "Data Science and Prediction". cacm.acm.org (in ਅੰਗਰੇਜ਼ੀ). Retrieved 2024-02-27.
  3. Davenport, Thomas H.; Patil, D. J. (2012-10-01). "Data Scientist: The Sexiest Job of the 21st Century". Harvard Business Review. ISSN 0017-8012. Retrieved 2024-02-27.
  4. "1. Introduction: What Is Data Science? - Doing Data Science [Book]". www.oreilly.com (in ਅੰਗਰੇਜ਼ੀ). Retrieved 2024-02-27.
  5. Driscoll, Michael (2009-05-27). "the three sexy skills of data geeks". m. e. driscoll (in ਅੰਗਰੇਜ਼ੀ (ਅਮਰੀਕੀ)). Retrieved 2024-02-27.
  6. Yau, Nathan (2009-06-04). "Rise of the Data Scientist". FlowingData (in ਅੰਗਰੇਜ਼ੀ). Retrieved 2024-02-27.
  7. "ASA Statement on the Role of Statistics in Data Science | Amstat News" (in ਅੰਗਰੇਜ਼ੀ (ਅਮਰੀਕੀ)). 2015-10-01. Retrieved 2024-02-27.
  8. Priceonomics (2015-10-13). "What's the Difference Between Data Science and Statistics?". Priceonomics (in ਅੰਗਰੇਜ਼ੀ). Retrieved 2024-02-27.
  9. "Statistics is the least important part of data science | Statistical Modeling, Causal Inference, and Social Science". statmodeling.stat.columbia.edu. Retrieved 2024-02-27.