一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如何用PHP做一個機器學習數(shù)據(jù)集

奈因PCB電路板設計 ? 來源:機器之心 ? 作者:機器之心 ? 2021-08-25 11:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機器學習是一門通過數(shù)據(jù)來教計算機解決問題的科學,而不是編寫序列算法,讓指令逐個執(zhí)行。

一般來說,數(shù)據(jù)準備是機器學習的首要任務,通常包括兩個子步驟:創(chuàng)建數(shù)據(jù)集和轉(zhuǎn)換數(shù)據(jù)。

如果想構(gòu)建一個類似人類的 AI 象棋游戲,首要問題就是創(chuàng)建一個數(shù)據(jù)庫,并且該數(shù)據(jù)庫需要盡可能多的包含象棋大師玩游戲的數(shù)據(jù)。通常情況下,大多數(shù)人使用 Python 構(gòu)建數(shù)據(jù)集,并且在一定程度上認為 Python 是數(shù)據(jù)科學的唯一編程語言。

但是,項目作者 Jordi Bassaganas 打破流行觀點(該觀點認為 Python 是世界上唯一用于數(shù)據(jù)科學的編程語言),不使用 Python,而是在構(gòu)建數(shù)據(jù)中使用了 MySQL、PHP 和 Rubix ML,其中 Rubix ML 是一個高級機器學習庫,可構(gòu)建使用 PHP 語言從數(shù)據(jù)中學習的程序。

項目地址:https://github.com/programarivm/chess-data

項目介紹

該項目是一組命令行界面(Command-Line Interface,CLI)工具,可幫助管理 PGN 游戲中的象棋數(shù)據(jù)庫,此外,該工具還可以進行數(shù)據(jù)準備、可視化數(shù)據(jù)和使用 Rubix ML 訓練監(jiān)督模型。

所謂的 PGN 就是「可移植式棋局記號法」(Portable Game Notation),是一種以 ASCII 文本文件表示國際象棋棋局數(shù)據(jù)的標準設定。PGN 設計成使人們很容易進行閱讀和編寫,電腦程序很容易進行解析和產(chǎn)生。定義和傳播 PGN 的目的,是為了促進公開對局數(shù)據(jù)的共享交流,包括來自全世界的棋手 (不管有無組織)、出版人和電腦國際象棋研究的。

接下來真正的問題是:應該給計算機提供哪些示例以使機器學習變得更容易?

這個數(shù)據(jù)準備存儲庫主要任務是將數(shù)百萬個象棋游戲加載到 SQL 數(shù)據(jù)庫中。作者從 PGN Mentor 中下載了 PGN 文件,PGN Mentor 是一個用于國際象棋研究的軟件應用程序,同時還提供了一個包含數(shù)百萬個游戲的文件集合,并將這些文件復制到 programarivm/chess-data/data/players 文件夾中。

其實使用 PHP 為機器學習準備數(shù)據(jù)集并沒有什么簡單方法。但實現(xiàn)過程涉及到不同的技術,這是關于對處理問題的理解、收集和過濾數(shù)據(jù)的最好實踐過程。

例如,當涉及國際象棋時,首先你需要過濾和驗證游戲,這意味著要刪除那些語法上無效或包含錯誤的游戲。cli/pgn-validate.php 命令查找 PGN 文件中錯誤,這條命令在將信息加載到數(shù)據(jù)庫時會被廣泛使用。

示例展示

下面展示了使用該項目設置和運行 MySQL 國際象棋數(shù)據(jù)庫,第一步是創(chuàng)建如下所示的象棋數(shù)據(jù)庫:

$ php cli/db-create.php

然后,按照下面的描述,games 表將被植入有效數(shù)據(jù)。

$ time php cli/db-seed.php data/players? 15 games did not pass the validation.? 3234 games out of a total of 3249 are OK.? 1353 games out of a total of 1353 are OK.? 1900 games out of a total of 1900 are OK.? 776 games out of a total of 776 are OK.? 1 games did not pass the validation.? 1660 games out of a total of 1661 are OK.? 4 games did not pass the validation.。..? 1124 games out of a total of 1124 are OK.? 265 games out of a total of 265 are OK.? 1 games did not pass the validation.? 2099 games out of a total of 2100 are OK.

cli/db-seed.php 命令需要大約 40 分鐘才能加載大約 400,000 個游戲。

mysql》 select count(*) from games;+----------+| count(*) |+----------+| 402658 |+----------+1 row in set (0,23 sec)

值得一提的是,所有這些都是用 PHP 語言實現(xiàn)的!

建立好國際象棋數(shù)據(jù)庫后,就可以為機器學習算法準備數(shù)據(jù)。在接下來的文章中,項目作者將詳細說明如何通過使用多層感知器分類器和該數(shù)據(jù)庫,進行國際象棋防守、戰(zhàn)術等的開發(fā)。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    35040

    瀏覽量

    279008
  • PHP
    PHP
    +關注

    關注

    0

    文章

    454

    瀏覽量

    27499
  • 機器學習
    +關注

    關注

    66

    文章

    8501

    瀏覽量

    134529

原文標題:用“最好的語言”PHP,做一個機器學習數(shù)據(jù)集

文章出處:【微信號:pcbgood,微信公眾號:奈因PCB電路板設計】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    功德+1,用小安派-Eyes-S1做一個電子木魚

    2024積德累功,心想事成!接下來看看如何用小安派-Eyes-S1做一個電子木魚。01GUI-Guider頁面設計先新建工程。直接進入UI設計界面,這里用到了兩
    的頭像 發(fā)表于 04-09 18:38 ?346次閱讀
    功德+1,用小安派-Eyes-S1<b class='flag-5'>做一個</b>電子木魚

    傳統(tǒng)機器學習方法和應用指導

    用于開發(fā)生物學數(shù)據(jù)機器學習方法。盡管深度學習般指神經(jīng)網(wǎng)絡算法)是
    的頭像 發(fā)表于 12-30 09:16 ?1172次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    cmp在機器學習中的作用 如何使用cmp進行數(shù)據(jù)對比

    機器學習領域,"cmp"這個術語可能并不是常見的術語,它可能是指"比較"(comparison)的縮寫。 比較在機器
    的頭像 發(fā)表于 12-17 09:35 ?866次閱讀

    構(gòu)建云原生機器學習平臺流程

    構(gòu)建云原生機器學習平臺是復雜而系統(tǒng)的過程,涉及數(shù)據(jù)收集、處理、特征提取、模型訓練、評估、部署和監(jiān)控等多個環(huán)節(jié)。
    的頭像 發(fā)表于 12-14 10:34 ?426次閱讀

    基于火語言RPA做一個發(fā)貨機器

    基于火語言RPA開發(fā)發(fā)貨機器人是相對復雜但非常實用的項目,特別是在電商和物流領域。以下是
    的頭像 發(fā)表于 12-11 14:42 ?464次閱讀

    利用ADS869X做一個隔離的高速數(shù)據(jù)采集系統(tǒng),ADC需要時鐘信號,可以自己外接晶振電路嗎?

    我想利用ADS869X做一個隔離的高速數(shù)據(jù)采集系統(tǒng),原理圖為Datasheet 里面的 Figure 8-1. 18-Bit Isolated DAQ System for High
    發(fā)表于 11-26 07:11

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統(tǒng)自身的性能”。事實上,由于“經(jīng)驗”在計算機系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機器學習需要設法對數(shù)據(jù)進行分析學習,這就使得它逐漸成為智
    的頭像 發(fā)表于 11-16 01:07 ?957次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為種專門為深度學習
    的頭像 發(fā)表于 11-15 09:19 ?1190次閱讀

    eda在機器學習中的應用

    值和噪聲數(shù)據(jù)。通過繪制箱線圖、直方圖和散點圖,我們可以直觀地看到數(shù)據(jù)中的異常值和分布情況。例如,如果個數(shù)據(jù)集中的某個特征值遠高于其他值,這可能是
    的頭像 發(fā)表于 11-13 10:42 ?878次閱讀

    人工智能、機器學習和深度學習存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設備。AI有很多技術,但其中很大的子集是機器學習——讓算法從數(shù)據(jù)
    發(fā)表于 10-24 17:22 ?2961次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區(qū)別

    何用恒流電源驅(qū)動LED和激光二極管

    今天我們將學習什么是恒流電源?以及如何用恒流電源驅(qū)動 LED 和 激光二極管。
    的頭像 發(fā)表于 10-15 14:23 ?2655次閱讀
    如<b class='flag-5'>何用</b>恒流電源驅(qū)動LED和激光二極管

    如何使用合宙的DTU+業(yè)務云平臺,做一個溫濕度傳感器數(shù)據(jù)采集項目?

    使用合宙的DTU+業(yè)務云平臺,做一個溫濕度傳感器數(shù)據(jù)采集項目,超詳細教程。
    的頭像 發(fā)表于 09-18 11:11 ?904次閱讀
    如何使用合宙的DTU+業(yè)務云平臺,<b class='flag-5'>做一個</b>溫濕度傳感器<b class='flag-5'>數(shù)據(jù)</b>采集項目?

    何用TLC2272C做一個耳機的功放?

    需要用TLC2272C做一個耳機的功放,請?zhí)峁?b class='flag-5'>一下典型應用的例子,謝謝
    發(fā)表于 09-06 06:37

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的重要環(huán)節(jié),目標是從給定的時間序列
    發(fā)表于 08-14 18:00

    如何將ESP826的數(shù)據(jù)POST到xammpp服務器上的php文件?

    我最初嘗試使用 8 變量,但現(xiàn)在只設置了 2 個字段 數(shù)據(jù)庫來測試它。使用相同的 PHP 文件從瀏覽器發(fā)送 POST it work
    發(fā)表于 07-19 07:26