python调用c语言实现数独计算逻辑提速100倍(代码片段)

小小明(代码实体) 小小明(代码实体)     2022-12-11     465

关键词:

之前我们实现python自动玩数独游戏,详见:《让程序自动玩数独游戏让你秒变骨灰级数独玩家

链接:https://blog.csdn.net/as604049322/article/details/118583461

最终达到了这样的效果:

中间我们将一个超难的数独,程序计算耗时由17秒优化到3秒,有读者希望将计算数独的逻辑用C++改写一遍重发。

完全不会C/C++的我,想到能否将计算逻辑用C语言或go语言重写后,交给Python调用实现程序性能的进一步优化。经过几十次瞎尝试,顺利用Python调用了c语言编写的计算逻辑,成功将程序优化到耗时1毫秒以内。后面也尝试了python调用go语言,但是不知道如何通过python生成[]byte的splice对象,只好宣步失败,也说明python借助ctypes调用go语言并不是那么随心所欲,还是直接调用c语言来的方便。

下面看看python调用c语言的操作流程:

Python调用c语言

下载gcc编译工具

作为非专业人士用MinGW就够了,官方下载地址是:https://sourceforge.net/projects/mingw-w64/

百度云下载地址:
https://pan.baidu.com/s/1ZmjQUf5QcBbeHCi7mIrYxg 提取码: edc5

本人使用的是win10系统,经测试x86_64-8.1.0-release-win32-seh-rt_v6-rev0好使。

下载并解压后,将MinGW的bin目录加入环境变量中:

命令行执行gcc -v出现如下提示后说明安装成功:

C语言解数独代码

编写c语言的解数独的代码:

#include <stdio.h>
#include <limits.h>
#include <stdlib.h>
#include <string.h>

typedef enum __bool  false = 0, true = 1,  bool;

int line[9];
int column[9];
int block[3][3];
bool valid;
int* spaces[81];
int spacesSize;

void flip(int i, int j, int digit) 
    line[i] ^= (1 << digit);
    column[j] ^= (1 << digit);
    block[i / 3][j / 3] ^= (1 << digit);


void dfs(char** board, int pos) 
    if (pos == spacesSize) 
        valid = 1;
        return;
    

    int i = spaces[pos][0], j = spaces[pos][1];
    int mask = ~(line[i] | column[j] | block[i / 3][j / 3]) & 0x1ff;
    for (; mask && !valid; mask &= (mask - 1)) 
        int digitMask = mask & (-mask);
        int digit = __builtin_ctz(digitMask);
        flip(i, j, digit);
        board[i][j] = digit + '0' + 1;
        dfs(board, pos + 1);
        flip(i, j, digit);
    


void solveSudoku(char** board) 
    memset(line, 0, sizeof(line));
    memset(column, 0, sizeof(column));
    memset(block, 0, sizeof(block));
    valid = 0;
    spacesSize = 0;

    for (int i = 0; i < 9; ++i) 
        for (int j = 0; j < 9; ++j) 
            if (board[i][j] != '.') 
                int digit = board[i][j] - '0' - 1;
                flip(i, j, digit);
            
        
    

    while (true) 
        bool modified = false;
        for (int i = 0; i < 9; ++i) 
            for (int j = 0; j < 9; ++j) 
                if (board[i][j] == '.') 
                    int mask = ~(line[i] | column[j] | block[i / 3][j / 3]) & 0x1ff;
                    if (!(mask & (mask - 1))) 
                        int digit = __builtin_ctz(mask);
                        flip(i, j, digit);
                        board[i][j] = digit + '0' + 1;
                        modified = true;
                    
                
            
        
        if (!modified) 
            break;
        
    

    for (int i = 0; i < 9; ++i) 
        for (int j = 0; j < 9; ++j) 
            if (board[i][j] == '.') 
                spaces[spacesSize] = malloc(sizeof(int) * 2);
                spaces[spacesSize][0] = i;
                spaces[spacesSize++][1] = j;
            
        
    

    dfs(board, 0);

上述函数,未编写main函数直接在c语言中测试,而是在后续python调用中测试通过。若有对c语言感兴趣的童鞋,可以自行编写main函数,直接运行c程序进行测试。

个人使用以下main函数进行测试:

int main() 
    char *board[] =
        "...6...3.", "5.....6..", ".9...5...",
        "..4.1...6", "...4.3...", "8...9.5..",
        "...7...4.", "..5.....8", ".3...8..."
    ;
    for(int i=0;i<9;i++)
        printf ("%s\\n",board[i]);
    solveSudoku((char**)board);
    for(int i=0;i<9;i++)
        printf ("%s\\n",board[i]);
    return 0;

结果程序在solveSudoku的递归调用中直接停止运行,无法得到结果。如果有对c语言编译器比较熟悉的读者,看看能不能给个简单的解决方案。

但神奇的是,后续测试发现Python却能正常调用这个函数,真是神奇,这似乎说明有些c代码无法在纯c的环境中跑,需要在Python等其他高级环境中才能跑?间接性说明Python和c语言可以结合起来一起用,既能享受Python的便捷,又能享受c语言操作内部字节的高效。

下面我们继续操作:

将C代码编译为动态链接库

假设上述代码的文件名是solveSudoku.c,使用如下命令编译:

gcc -shared solveSudoku.c -o solveSudoku.dll

注意:以上编译命令仅针对Windows平台编译测试通过,Mac平台可能需要-Wl和-fPIC参数

Python调用C语言

准备就绪,现在开始使用python来调用c语言。为了向c函数传入二维char指针,着实让我犯了难。在经过几十次测试后,居然实验成功了一种方法,可能这个方法并不是最优的,但确实已经是一种简单可行的方案。

最终编写的python代码如下:

import time
from ctypes import *
from pprint import pprint


def solveSudoku(board: list):
    c_char_datas = (c_char_p * 9)()
    for i in range(9):
        row_chars = "".join(board[i]).encode('utf-8')
        c_char_datas[i] = c_char_p(row_chars)
    solve_sudoku_c = cdll.LoadLibrary('solveSudoku.dll').solveSudoku
    solve_sudoku_c(c_char_datas)
    return [list(row.decode()) for row in c_char_datas]


board = [
    ['.', '.', '.', '6', '.', '.', '.', '3', '.'],
    ['5', '.', '.', '.', '.', '.', '6', '.', '.'],
    ['.', '9', '.', '.', '.', '5', '.', '.', '.'],
    ['.', '.', '4', '.', '1', '.', '.', '.', '6'],
    ['.', '.', '.', '4', '.', '3', '.', '.', '.'],
    ['8', '.', '.', '.', '9', '.', '5', '.', '.'],
    ['.', '.', '.', '7', '.', '.', '.', '4', '.'],
    ['.', '.', '5', '.', '.', '.', '.', '.', '8'],
    ['.', '3', '.', '.', '.', '8', '.', '.', '.']
]
start = time.time()
pprint(board)
board = solveSudoku(board)
pprint(board)
print(f"耗时:time.time() - start:.2fs")

结果:

[['.', '.', '.', '6', '.', '.', '.', '3', '.'],
 ['5', '.', '.', '.', '.', '.', '6', '.', '.'],
 ['.', '9', '.', '.', '.', '5', '.', '.', '.'],
 ['.', '.', '4', '.', '1', '.', '.', '.', '6'],
 ['.', '.', '.', '4', '.', '3', '.', '.', '.'],
 ['8', '.', '.', '.', '9', '.', '5', '.', '.'],
 ['.', '.', '.', '7', '.', '.', '.', '4', '.'],
 ['.', '.', '5', '.', '.', '.', '.', '.', '8'],
 ['.', '3', '.', '.', '.', '8', '.', '.', '.']]
[['7', '4', '1', '6', '2', '9', '8', '3', '5'],
 ['5', '8', '2', '3', '4', '1', '6', '9', '7'],
 ['3', '9', '6', '8', '7', '5', '4', '2', '1'],
 ['9', '2', '4', '5', '1', '7', '3', '8', '6'],
 ['6', '5', '7', '4', '8', '3', '2', '1', '9'],
 ['8', '1', '3', '2', '9', '6', '5', '7', '4'],
 ['1', '6', '8', '7', '5', '2', '9', '4', '3'],
 ['2', '7', '5', '9', '3', '4', '1', '6', '8'],
 ['4', '3', '9', '1', '6', '8', '7', '5', '2']]
耗时:0.04s

非常棒,1毫秒内已经完成数独题的解题,比之前用python编写的相同逻辑的代码快了近100倍。

Python调用C进行数独解题的完整代码

那么之前的完整代码可以修改为:

"""
小小明的代码
CSDN主页:https://blog.csdn.net/as604049322
"""
__author__ = '小小明'
__time__ = '2021/7/23 17:09'

from ctypes import *

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import WebDriverWait

browser = webdriver.Chrome()
url = "https://www.sudoku.name/index.php?ln=cn&puzzle_num=&play=1&difficult=4&timer=&time_limit=0"
browser.get(url)

wait = WebDriverWait(browser, 10)

table = wait.until(EC.element_to_be_clickable(
    (By.CSS_SELECTOR, 'table#sudoku_main_board')))

board = []
for tr in table.find_elements_by_xpath(".//tr"):
    row = []
    for input_e in tr.find_elements_by_xpath(".//input[@class='i3']"):
        cell = input_e.get_attribute("value")
        row.append(cell if cell else ".")
    board.append(row)


def solveSudoku(board: list):
    c_char_datas = (c_char_p * 9)()
    for i in range(9):
        row_chars = "".join(board[i]).encode('utf-8')
        c_char_datas[i] = c_char_p(row_chars)
    solve_sudoku_c = cdll.LoadLibrary('solveSudoku.dll').solveSudoku
    solve_sudoku_c(c_char_datas)
    return [list(row.decode()) for row in c_char_datas]


board = solveSudoku(board)

for i, tr in enumerate(table.find_elements_by_xpath(".//tr")):
    for j, input_e in enumerate(tr.find_elements_by_xpath(".//input[@class='i3']")):
        if input_e.get_attribute("readonly") == "true":
            continue
        input_e.click()
        input_e.clear()
        input_e.send_keys(board[i][j])

import一个“太极”库,让python代码提速100倍!

丰色发自凹非寺量子位|公众号QbitAI众所周知,Python的简单和易读性是靠牺牲性能为代价的——尤其是在计算密集的情况下,比如多重for循环。不过现在,大佬胡渊鸣说了:只需import一个叫做“Taichi”的库,就... 查看详情

import一个“太极”库,让python代码提速100倍!

丰色发自凹非寺量子位|公众号QbitAI众所周知,Python的简单和易读性是靠牺牲性能为代价的——尤其是在计算密集的情况下,比如多重for循环。不过现在,大佬胡渊鸣说了:只需import一个叫做“Taichi”的库,就... 查看详情

胡渊鸣:import一个“太极”库,让python代码提速100倍!

丰色发自凹非寺量子位|公众号QbitAI众所周知,Python的简单和易读性是靠牺牲性能为代价的——尤其是在计算密集的情况下,比如多重for循环。不过现在,大佬胡渊鸣说了:只需import一个叫做“Taichi”的库,就... 查看详情

基于概率分析的智能ai扫雷程序秒破雷界世界纪录(代码片段)

...1a;《让程序自动玩数独游戏让你秒变骨灰级数独玩家》《Python调用C语言实现数独计算逻辑提速100倍》今天我将带你用非常高端的姿势玩扫雷。本文涉及的技术点非常多,非常硬核,万字长文,高能预警。本文从图像... 查看详情

c++-采样函数gridsampling(采样提速必备)(代码片段)

场景需求    采样是在做大量数据计算时常用的优化方法,合理的采样方式可以使计算速度提高数十倍数百倍。比如原本1000*1000的图像数据要进行百次迭代计算,运用采样法提取100*100的图像数据进行分析,最少提速... 查看详情

如何让xcode在读写上提速100倍?

如何让Xcode在读写上提速100倍?上个月参加了一场西雅图当地的线下iOS开发者聚会。JeffSzuhay作为一个有20+年开发经验的资深程序员,跟我讲了一套提高iOS开发效率的方法。相比于其他程序员在App启动时间、架构优化方面的经验,... 查看详情

快出数量级的性能是怎样炼成的

...a;原先都是用各种数据库(也有HADOOP/Spark)上的SQL实现的,包括查询用的几百行SQL也有跑批用的几千行存储过程,然后我们改用集算器的SPL重新实现之后就有了这样的效果。集算器SPL有什么 查看详情

如何让xcode在读写上提速100倍?

...运行或编译时,会有大量的读写操作。例如从硬盘中调用图片,我们会这么操作:letimage=UIImage(named:"imageName")这时候Xcode就会去电脑的硬盘中去找到图片,完成读写操作。类似的操作还有存取文件等等。如... 查看详情

python之父爆料:明年至少令python提速1倍!(代码片段)

...程序员交流群????????作者:豌豆花下猫  来源:Python猫  大概在半年前,我偶然看到一篇文章,有人提出了给Python提速5倍的计划,并在寻找经费赞助。当时并没有在意,此后也没有看到这方面的消息。但... 查看详情

本科生新算法打败nerf,不用神经网络照片也能动起来,提速100倍|开源

...法。不需要神经网络,仅仅通过梯度下降和正则化便实现了同样的效果,而且速度还快了100倍!那么他们是如何做到这点的呢?由NeRF到Plenoxels的进化为了帮助大家理解Plenoxels,我们先来简单介绍一下NeRF模型。... 查看详情

本科生新算法打败nerf,不用神经网络照片也能动起来,提速100倍|开源

...法。不需要神经网络,仅仅通过梯度下降和正则化便实现了同样的效果,而且速度还快了100倍!那么他们是如何做到这点的呢?由NeRF到Plenoxels的进化为了帮助大家理解Plenoxels,我们先来简单介绍一下NeRF模型。... 查看详情

提速10倍!深度解读字节跳动新型云原生sparkhistoryserver

...件日志文件,它在缩小了近乎10倍体积的基础上,居然还实现了提速10倍!!!目前,UIMetaService已经取 查看详情

快出数量级的性能是怎样炼成的?(代码片段)

...分析从5并发到100并发开源SPL提速银行用户画像客群交集计算200+倍开源SPL优化银 查看详情

快出数量级的性能是怎样炼成的(代码片段)

...分析从5并发到100并发开源SPL提速银行用户画像客群交集计算200+倍开源SPL优化银 查看详情

你敢信!?几行代码让swift数组初始化提速440+倍!

...时为:53.855秒0.36秒0.12秒最快加速高达448倍!那么,如何实现如此悬殊的速度优化呢?别急,实现超乎寻常的简单,Followme,你值得拥有!功能分析1. 查看详情

10个python办公黑科技,助你办公效率提高100倍(代码片段)

1946年,世界上第一台通用计算机“ENIAC”在美国宾夕法尼亚大学诞生;“ENIAC”占地170平方米,重达30吨,耗电功率约150千瓦,每秒钟可进行5000次运算,这个庞然大物用于美国国防部进行弹道计算。在当时&... 查看详情

深度学习提速10倍!

点上方人工智能算法与Python大数据获取更多干货在右上方 ··· 设为星标 ★,第一时间获取资源仅做学术分享,如有侵权,联系删除转载于:量子位面对数以亿计的图片数据,到底该用什么样的方法才能快... 查看详情

深度学习提速10倍!

点上方人工智能算法与Python大数据获取更多干货在右上方 ··· 设为星标 ★,第一时间获取资源仅做学术分享,如有侵权,联系删除转载于:量子位面对数以亿计的图片数据,到底该用什么样的方法才能快... 查看详情